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1].1] 背 景 


我 们 常 说 单间 不 如 一 见 、 这 是 因为 人 的 视觉 、 感 观 对 图 像 非 常 强 烈 . 往往 用 笔墨 还 不 足 
以 形容 。 例如 ， 陈 述 一 个 小 女孩 有 多 可 过 ， 与 其 用 尽 所 有 形容 词 ， 不 如 出 示 一 张 她 的 照片 。 

显然 图 像 是 传达 信息 非常 直接 又 有 效 的 方式 ， 但 是 倘若 上 述 照片 没有 拍 好 ( 例如 光线 不 
足 及 拍摄 时 手 部 额 持 等 问题 ， 则 其 信息 传达 的 效果 可 能 还 不 如 用 童 证 形容 . 虽然 有 些 照片 可 
凡 重 拍 ， 但 也 有 很 多 情况 是 很 难 或 甚至 无 法 再 重 拍 的 .例如 负责 太空 探测 的 太空 船 所 传 回 的 
珍贵 照片 ， 由 于 经 济 及 时 效 上 的 考虑 ， 通 苘 不 会 有 第 二 次 重 拍 的 机 会 : 在 我 们 日 常生 活 当 中 
也 有 许 煞 珍贵 的 历史 性 镜头 是 不 能 有 重 拍 机 会 的 ， . 

对 于 效果 不 佳 的 图 片 ， 特 别 是 记录 验 贵 历史 性 时 刻 者 ， 如 果 能 以 经 济 又 有 效 的 方式 加 以 
处 理 ， 使 其 达到 原本 能 传递 的 信息 量 ， 是 不 十 很 好 呢 ? 这 就 是 转 像 处 理 [image processing) 所 
要 探讨 的 课题 ， 换 言 之 就 是 如 何 有 效 {effective) 又 有 效率 {fefficienp 地 来 处 理 殴 像 ， 使 其 能 传 
达 我 们 所 需要 的 信息 、 

孝 数 字 图 像 处 理 (digital image processing) 又 是 什么 呢 ” 简 言 之 就 是 将 所 撕 取 到 的 图 像 数 
字 化 (digitizej， 以 利 电脑 的 处 理 ， 比 起 像 摄 影 师 暗房 技巧 那 一 类 的 所 谓 光 学 图 像 处 理 以 及 像 
调整 电视 机 旋钮 改变 电压 使 对 比 度 或 亮度 改变 的 类 似 图 像 处 理 ， 数 字 图 像 处 理 有 更 大 的 弹性 
(ffexibility) 以 及 效率 。 数 字 图 像 处 理 除 可 改善 图 像 信息 使 人 理解 外 ， 它 还 能 使 机 器 像 人 一 样 
具有 视 党 感官 的 能 力 。 不论 是 过 去 许多 已 成 功 的 数字 图 像 处 理应 用 还 是 更 铬 正 在 开发 中 的 应 
用 ， 都 属 这 两 类 - 

虽然 图 像 处 理 技 术 最 早期 的 应 用 之 一 可 回潮 到 20 世纪 初 , 用 来 政 善 伦敦 和 纽约 间 经 海底 
电缆 发 送 的 图 像 的 品质 ,得 一 直到 20 世纪 50 年 代 ， 随 着 大 型 数字 计算 机 和 太空 科学 研究 计 
划 的 出 更 ,大 家 才 注 意 到 图 像 处 理 的 潜力 ，1964 年 在 美国 航 太 总 署 的 喷射 推进 实验 室 开始 用 
计算 机 技术 改善 从 太空 探 测 器 获得 的 图 像 ， 当 时 用 计算 机 处 理由 术 航 考 七 号 (Ranger 7) 传 回 
的 月 球 图 片 ， 以 校正 电视 摄影 机 所 存在 的 九 何 失 真 或 响应 失真 。 其 后 有 一 连 串 的 星际 探测 计 
划一 直到 现在 都 在 持续 不 断 邮 送 回 更 多 图 像 ， 

从 1964 年 迄今 ， 图 像 处 理 领域 -- 直 快速 地 发 展 着 。 除 了 在 太空 计划 中 的 应 用 ， 目 前 数字 
图 像 处 理 技 术 还 用 于 解决 其 他 问题 。 主 要 的 应 用 领域 如 下 : 


和 生物 医学 领域 


首先 用 于 细胞 分 类 、 米色 体 分 类 和 放射 图 像 的 处 理 。1972 年 和 光电 脑 断 层 扫描 (computer 
tomogtaphy，CT) 获得 实际 应 用 , 在 医学 工程 上 为 一 大 突 厂 ; 1977 年 白 备 球 自动 分 析 仪 癌 世 ; 
1980 年 研究 出 心脏 活动 立体 图 像 的 技术 。 医学 图 像 的 冲 类 包括 和 光 图 像 . 同位 素 图 像 、 核 磁 
共振 图 像 、 超 声波 图 像 、 红 外 线 图 像 以 及 显 微 图 像 等 .对 这 些 图 像 作对 比 度 开 强 或 伪 彩 色 等 
的 处 理 可 帮助 医师 诊断 如 肺病 、 肿 瘤 及 心血 管 等 疾病 。 


香 对 测 烤 据 分 析 
迁 测 常 以 颜色 为 依据 ， 由 飞机 、 卫 星 及 太空 船上 的 多 光谱 (muiti-spectral) 扫描 器 摄 得 图 
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像 ， 范 围 从 可 见 光 至 红外 光 (有 时 含 紫外 光 ) 分 成 几 个 频带 ， 每 个 频带 所 摄 得 的 颜色 都 不 同 ， 
可 用 于 土地 使 用 、 作 物 收 成 、 作 物 病害 侦 测 、 森 林 及 水 资源 调查 、 环 境 污染 侦 测 、 地 质 与 地 
形 分 析 . 矿藏 探 勒 及 气象 预测 等 。 由 于 数据 量 庞 大 ， 因 此 寻求 处 理 及 分 析 这 些 图 像 的 自动 方 
法 ， 特 别 是 图 像 对 比 度 增 强 、 分 割 及 图 像 识 别 的 技术 显得 极为 重要 。 


e@ 科学 研究 
例如 考古 学 可 用 图 像 处 理 方法 恢复 模 灶 或 其 他 降 质 状况 的 珍贵 文物 图 像 。 这 些 文物 在 拍 


成 照片 后 已 遗失 或 损坏 ， 因 此 这 些 照 片 成 为 叭 一 可 用 的 记录 。 叉 如 在 物理 学 上 可 增强 在 高 能 
态 电 浆 及 电子 显微镜 等 场合 所 拍 下 的 实验 图 像 ， 以 增加 对 实验 结果 的 了 解 。 


急 一 般 工 商业 应 用 


这 一 方面 已 有 许多 实例 ， 例 如 用 无 损 图 像 处 理 方式 检查 零件 内 部 的 瑕 疫 及 烽 接 品质 、 金 属 
材料 的 成 分 与 结构 分 析 、 纺 织品 品质 检测 、 印 刷 电 路 板 及 焊 点 不 良 检查 、 零 件 安装 检查 等 。 又 
如 邮政 编码 自动 读 取 系统 、 运 动员 运动 图 像 分 析 . 机 髓 人 自 走 道路 状况 判断 . 组 装 霍 件 识别 、 
光学 字 的 读 取 与 辨认 、 条 形 码 读 取 指纹、 瞳孔、 颜面 等 图 像 的 身份 识别 、 试 装 及 发 型 设计 等 。 


@@ 通讯 与 电脑 资料 存储 


包括 传真 机 、 可 视 电话 及 电视 会 议 等 都 采用 图 像 数据 压缩 的 技术 , 使 通讯 更 快速 。 此 外 ， 
采用 同样 技术 可 大 大 降低 图 像 数据 存储 量 以 降低 存储 负担 。 


整个 图 像 处 理 的 领域 仍 在 攻 勃 发 展 中 ， 其 原因 有 : 忆 电脑 功能 对 价格 比 越 来 越 高 ; 
吧 图 像 所 取 与 显示 设备 更 加 普遍 与 便利 ; 多 图 像 处 理 的 观念 普及 ， 容 易 创 造 新 的 应 用 。 预 期 
数字 图 像 处 理 在 我 们 未 来 生活 中 将 扮演 耸 来 您 重要 的 角色 。 


1.2 图 像 的 表示 


图 像 最 广义 的 观点 是 指 视觉 信息 。 举 凡 有 照片， 图画、 电视 画面 以 及 由 透镜 、 光 栅 及 全 息 
图 (bologratm) 所 构成 的 光学 成 像 等 均 属 之 。 

令 FGoo pe 用 代表 上 述 图 像 源 在 空间 坐标 (x, 妨 , 时 间 : 且 波 长 为 4 情况 下 的 空间 能 量 分 
布 ， 此 分 布 通常 可 视 为 一 个 具 正 实数 旺 有 上 界 的 光 强 度 函 数 ， 亦 即 


和 < fr 放生 攻 (2-1) 


其 中 4 为 最 大 的 图 像 强度 。 此 外 不 论 就 实际 图 像 的 考虑 或 数学 上 讨论 的 方便 ，zy 与 + 应 该 也 
都 是 有 界 的 ， 例 如 


0 去 y 反 区 (1.2-2) 
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我 们 对 上 述 光 强度 画 数 的 反应 常用 瞬间 强度 来 表示 
JoyD=| FeptarC)da (1.2-3) 


其 中 FJ) 为 相对 亮度 效率 函数 ， 换 言 之 是 人 类 视觉 的 频谱 响应 。 同 理 ， 人 对 色彩 的 反应 也 可 
用 类 似 (1.2.3) 式 的 方式 来 表示 。 对 一 个 任意 的 红 一 绿 一 蓝 坐 标 系统 ， 其 三 基色 的 瞬间 值 为 


广 GpD=| Fe4)RQ)d4 (2-43) 
太 人 人 = | Foy #4G(4)d4 (1.2-4b) 
六 人 ppD= Faa)BQ)d4 (1.2-49) 


其 中 RQ),GQ) ,BC 分 别 为 对 红 、 绿 、 蓝 三 基色 的 频谱 响应 。 如 果 是 更 多 个 感应 的 图 像 ， 则 
第 ;个 频谱 的 图 像 为 


jGpD= Fep2S QIa4 (1.2-5) 





其 中 中 们 ) 是 第 ;个 感应 器 的 频谱 响应 . 

如 果 艾 像 内 容 不 随时 间 变 化， 或 相当 于 f = 5 (一 个 定 值 ) 时 所 得 图 像 ， 则 (1.2-1) 式 到 
(1.2-5) 式 中 的 时 间 因 子 可 去 掉 ， 此 时 所 得 图 像 称 为 静止 贸 像 (例如 一 张 照片 )， 反 之 称 为 活动 
图 像 (例如 电视 的 连续 画面 )。 ， 

恩 一 个 音色 (monochrome) 静止 豆 像 可 用 一 个 二 维 的 光 强 度 函 数 Fr,?) 来 表示 ， 其 中 
与 ?表示 空间 坐标 ， 而 在 任意 点 {z, 刀 的 了 值 与 在 该 点 图 像 的 亮度 [或 灰 度 ) 成 正比 . 一 个 数字 
豆 像 是 图 像 fx 妨 在 空间 坐标 和 亮度 工 都 数字 化 后 的 图 像 . 可 将 数字 图 像 视 为 一 个 矩阵 , 拢 
降 行 与 列 的 值 决 定 一 个 点 ， 而 对 应 的 矩阵 元 素 值 就 是 该 点 的 灰 度 。 这 种 矩阵 的 元 素 称 为 像素 
(Picture element 或 pixel )， 所 对 应 的 灰 庶 可 称 为 像素 值 。 因 此 像素 叮 以 说 是 数字 多 像 的 最 基 
本 单位 。 


1.3 数字 图 像 处 理 


数字 图 像 处 理 就 是 利用 电脑 对 数字 图 像 做 运算 ， 以 达到 1.1 节 所 述 的 许多 应 用 。 显 然 要 
有 效 解决 众多 的 图 像 处 理应 用 问题 ， 有 时 必须 研究 出 专门 为 其 量 身 打造 的 图 像 处 理 方法 ， 
不 过 大 致 上 可 将 这 些 问 题 及 其 图 像 处 理 方式 归纳 或 以 下 多 类 , 这 也 基本 书 主要 婉 讨 的 范围 : 
中 图 像 增强 

图 像 增强 (enhancemenft) 是 用 来 强调 图 像 的 某 些 特征 ， 以 便于 作 进一步 分 析 或 显示 。 例 如 
对 比 度 的 增强 是 用 来 使 对 比 度 低 的 图 像 更 容易 显现 其 特征 ， 而 低 对 比 度 的 可 能 原因 包括 光线 


不 足 ， 图 像 感应 器 的 动态 范围 不 够 以 及 在 图 做 摄取 时 光 贺 设 定 错误 等 。 图 像 增 强 的 过 程 本 身 
并 没有 增加 原 资料 所 含 的 信息 ， 它 只 是 把 图 像 某 些 部 分 的 特性 更 加 强调 时 了 。 图 像 增 强 的 算 
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法 通常 是 交互 式 (interactive) 而 且 与 所 考虑 的 应 用 有 密切 的 关系 。 图 1.3-1 是 一 个 图 像 增强 的 
实例 ， 其 中 人 图 是 一 低 对 比 度 图 像 ，(b) 图 则 是 其 经 过 图 像 增强 处 理 后 的 结果 。 





目 人 
fb) 经 图 像 增强 处 理 后 的 更 像 
图 1.3-1 图 俺 增强 实例 





(a) 低 对 比 度 图 像 


@ 图 像 恢 复 

图 像 恢复 (restoration) 是 指 将 图 像 已 知 的 降 质 因素 去 掉 或 减少 。 使 图 像 降 质 的 因素 包括 感 
应 器 或 拍摄 环境 产生 的 干扰 、 没 有 对 焦 所 造成 的 模糊 、 摄 像 机 与 物体 间 相 对 运动 所 造成 的 模 
糊 、 感 应 器 的 非 线性 几何 失真 等 。 图 像 焦 复 的 目的 是 试图 将 受 污染 或 降 质 的 图 像 带 回 到 原本 
不 受 污 染 的 状况 之 下 所 应 得 的 干净 图 像 。 虽 然 它 与 图 像 增强 都 会 造成 视觉 上 较 佳 的 感受 ， 但 
后 者 比较 关切 的 是 图 像 特 征 增强 或 抽取 而 不 是 去 除 退化 或 污染 , 图 1.3-2 是 一 个 图 像 恢复 的 实 
例 ， 其 中 图 (a) 是 受 干扰 污染 的 图 像 ，(b) 图 则 是 其 经 过 图 像 焦 复 后 的 结果 。 


0 过 个 








(al 受 污 染 图 像 仙 ) 勾 恢 复 处 理 的 图 像 
图 1.3-2 图像 恢复 实例 . 
旬 图 像 压 缩 
图 虱 压 缩 (compressiom) 的 目的 是 在 减低 代表 数字 图 像 所 需 的 数据 量 ， 这 样 做 的 好 处 是 可 
以 碱 少 图像 传 输 时 间 及 储存 空间 。 许 多 人 都 有 使 用 网 络 训 览 器 的 经 验 ， 如 果 是 单纯 的 文字 资 
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料 ， 通 常 传输 速度 较 快 ， 等 待 时 间 也 较 短 ; 但 如 果 夹 杂 图 像 ， 则 等 待 时 间 较 长 ， 而 且 等 待 时 
间 大 约 与 图 像 大 小 成 正比 。 这 是 为 什么 有 人 倡议 在 网 络 堵塞 的 情况 下 ，WWW 的 首页 应 尽量 
减少 不 必要 的 图 像 ， 或 用 较 小 的 图 像 。 图 像 数据 量 到 底 有 多 大 ? 以 一 个 1 024xl 024 大 小 且 每 
个 像素 8 bits (1 byte) 的 单 色 图 像 为 例 ， 约 是 1MB 的 存储 量 。 若 以 38.4 kbps 的 速率 传送 出 需 
1 024xl 024x8 /38 400 ( 秒 ] 或 约 为 3 分 38 秒 才 传送 完毕 。 图 1.3-3 是 一 个 图 像 压 缩 的 实例 ， 其 
中 (a) 图 是 原始 图 像 ，(b) 图 是 经 12 倍 压 缩 恢复 重建 后 的 图 像 ， 其 中 12 倍 压缩 是 指数 据 量 仅 
为 原来 的 12。 





人 @) 原始 图 像 人 b) 径 12 倍 压 缩 恢复 的 图 像 
图 1.3-3 图 像 压缩 实例 


急 图 像 重 建 


此 图 像 重 建 (reconstmcetion) 的 工作 是 由 几 个 一 维 的 图 像 投影 来 重建 出 更 高 维 的 物体 图 
像 。 一 个 图 像 投影 的 取得 是 以 平行 的 尽 光 (或 其 他 放射 穿 透 ) 光束 照射 物体 并 在 物体 背面 接收 
此 投影 重 ， 接 着 在 同一 平面 上 改变 光束 照射 的 角度 以 获得 不 同 的 投影 ， 再 以 某 些 重建 算法 将 
这 些 投 影 给 合 或 此 物体 的 一 个 横 剖 面 图 像 。 此 种 技术 主要 用 于 医学 图 像 (电脑 断层 扫描 )、 天 
文学 星象 观测 、 雷 达 图 像 处 理 、 地 质 研 究 及 无 损 检测 等 。 


妃 图 像 分 析 

图 像 分 析 (fanalysis) 是 试图 从 图 像 中 提取 并 描述 某 些 特征 ， 以 自动 产生 所 需 信 息 。 其 目标 
是 赋予 计算 机 或 机 器 像 人 一 样 看 东西 的 能 力 。 例 如 要 像 人 一 样 阅读 一 本 书 ， 至 少 需 具备 识别 
字 元 及 了 解 文章 的 功能 ， 更 不 用 说 归纳 、 整 理 及 推论 等 能 力 了 。 由 此 可 知 要 做 图 像 分 析 ， 必 
须 使 机 器 具备 某 种 程度 的 智慧 fintelligence)。 一 些 智 慧 的 特征 包括 : 名 能 从 含有 许多 不 相干 
细节 的 背景 中 找到 所 要 的 信息 ; 氏 能 从 范例 中 学 习 并 将 所 学 知识 应 用 推广 到 其 他 状况 中 ; 
声 能 从 不 完整 的 资料 中 推论 出 完整 的 资料 。 


1.4 数字 图 像 处 理 系统 


一 个 基本 的 数字 图 像 处 理 系统 应 包括 计算 机 处 理 或 存 情 单元 ， 以 及 显 像 或 记录 单元 。 如 
果 要 处 理 自己 撕 取 的 图 像 ， 刚 必须 再 加 大 撕 取 单 元 ， 整 个 基本 结构 如 图 1.4-1 所 示 。 
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图 1.4-1 数字 图 像 处 理 的 基本 结构 


1.4-1 反 取 


撒 取 的 目的 在 于 获取 一 个 数字 图 像 。 其 所 用 的 装置 统称 为 数字 化 仪 (digitizerj。 
数字 化 仪 含 下 列 四 大 组 成 元 素 : 
中 取样 孔 阶 (sampling aperture): 允许 数字 化 仪 个 别 获 取 每 一 个 像素 ， 而 暂 忽 略图 像 的 其 
他 部 分 -。 
外 图 像 扫 描 装 置 : 将 取样 孔 院 依 一 定 模式 在 图 像 上 移动 .使 像素 按 某 种 顺序 排列 。 
乾 光 感 应 器 (sensonD: 可 度量 光 透 过 取样 妃 队 所 获得 的 图 像 的 亮度 。 此 感应 器 基本 上 是 
一 种 将 光 的 强度 转变 成 电压 或 电流 的 转换 器 . 
二 重 化 器 (quantizer) : 将 感应 器 连续 性 数值 的 输出 变 成 有 限 个 可 能 值 。 通 常 这 是 由 模 
拟 一 数字 fanalog-to-digital) 转 换 器 的 电子 电路 所 达成 - 
常用 的 光源 有 和 白炽 灯 (finecandescenht bulb)、 激 沧 、 发 光 性 合成 物质 (phosphon 以 及 发 光 二 
极 管 (light-emitting diode)。 常 用 的 光 感 应 器 有 光 放 射 元 件 (photoemissive devicej、 硅 感应 器 . 
光 二 极 管 及 光电 晶体 等 。 扫 描 装 置 分 机 械 式 扫 措 元件、 电子 束 扫描 、 电 场 偏转 及 磁场 偏转 扫 
最 近 研 制 出 的 图 像 感应 器 是 电子 式 的 自我 扫描 固态 感应 器 阵列 。 主 要 有 三 种 :分 别 是 电 
车 耦合 元 件 (charge couple device, CCD) 阵列 、 电 荷 注入 元 件 (charge injection device, CID) 阵 
列 及 光 二 极 管 阵 列 . 所 有 这 些 元 件 都 在 一 个 单一 的 集成 电路 确 片 上 有 一 个 线性 或 矩形 的 光 感 
应 阵列 ， 而 且 都 有 将 人 射 医 像 所 产生 的 载 子 电荷 读 出 所 希 要 的 电子 电路 。 


1.4-2 储 大 


一 个 大 小 1024x1 024 的 12 位 图 像 需 要 1.5 MBUL.5x10*bytcs) 的 鱼 存 空间 ， 所 以 需求 相 
当 高 。 有 人 和 计 在 一 个 有 1 500 张 病 床 的 大学 医院 的 数字 网 像 资 料 ， 每 年 就 要 超过 
20TB(20x102bytes) 的 储存 空间 . 

按 储 存 时 间 长 得 ,储存 方式 大 致 可 分 为 三 类 : 全 处 理 过 程 所 需要 的 短暂 情 存 ; 饭 经 常 需 
要 在 取 的 储存 : 凶 ) 较 少 存 棒 的 存档 存储 (archival storage)。 

短暂 储存 的 简单 例子 就 是 电脑 中 极为 重要 的 存储 单元 之 -- 一 一 RAM， 即 随机 存储 单元 。 
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另 一 个 例子 就 是 一 个 称 为 是 示 缓 冲 区 (fame buffen 的 板子 ， 其 特色 是 可 快速 存 取 ， 通 常 以 每 
秒 30 个 画面 的 速度 做 更 新 。 

经 党 性 存 取 储存 的 例子 就 是 磁盘 ， 包 括 软 盘 及 硬盘 。 最 近 发 展 的 磁 光 盘 (magneto-optical， 
MO) 储存 ， 利用 激光 及 特殊 材料 的 技术 ,在 5{14) 时 光盘 上 可 有 将 近 1 GB 4x10?bytes) 的 
次 量 . 

存档 存储 的 两 个 特色 是 超大 容量 的 需求 和 存 取 较 不 频繁 。 最 佳 的 选择 是 写 一 次 读 多 次 
(write-once-read-many WORMD 的 光盘 ， 目 前 已 有 10 GB 以 上 容量 的 光盘 . 


1.4-3 计算 机 处 理 


数字 图 像 处 理 常 涉及 大 量 的 运算 ， 因 此 需要 计算 机 高 速 计 算 能 力 的 帮助 ， 除 了 有 部 时 
性 的 速度 要 求 才 需 要 特殊 硬件 计算 外 .一 般 都 是 在 通用 型 计算 机 上 以 软件 将 图 像 处 理 的 算 
法 实现 而 达到 处 理 的 效果 . 市面 上 已 有 许多 专 为 图 像 处 理 所 设计 的 套装 软件 ， 具 备 一 般 图 
像 处 理 的 功能 、 此 类 软件 通常 都 配 有 很 友好 的 图 形 介面 {graphies user interface, GUD， 相 当 
容易 使 用 。 

此 外 .还 可 用 一 般 用 途 的 编程 语言 来 实现 图 像 处 理 的 工作 .例如 C，C，Matlab 与 Java 
等 。 本 书 所 附 程序 范例 就 是 以 Matlab 的 语言 写成 的 。 


1.4-4 显 示 


图 像 处 理 前 后 的 结果 通常 可 借助 显示 设备 呈现 : 单 色 与 彩色 电视 监视 器 是 目前 最 常用 的 

显示 设备 : 通常 衡量 一 个 显示 设备 需 考 虑 下 列 因素 ; 

中 显示 的 图 像 的 天 小 : 一 个 考虑 是 实际 显示 设备 的 大 小 , 一 个 是 亲 容 许 显 东 的 冬 像 的 大 
小 - 

避 亮度 (photomettic) 解 析 度 :; 这 是 指 在 每 个 像素 位 置 产 生 正确 亮度 的 准确 性 。 例 如 能 产 
生 客 少 个 不 同 的 灰 度 级 ; 4 位 存储 能 处 埋 16 个 灰 度 级 ,8 位 存储 能 处 理 256 个 贡 度 级 
等 等 . 要 注意 若 显示 设 备 有 干扰 , 则 号 称 能 处 理 256 个 灰 度 级 的 显示 设备 未 必 能 稳定 
地 真正 呈现 出 256 个 不 同 的 灰 度 级 - 

二 其 度 的 线性 : 这 是 指 亮度 与 输入 灰 度 之 间 成 比例 的 程度 任何 显示 设备 都 有 一 个 输 人 
英 度 级 对 输出 亮度 的 转换 冰 数 ， 此 条 函数 曲线 的 理想 状 次 是 一 条 直线 . 或 是 有 明显 的 
一 段 为 直线 - 

册 显示 校正 : 一 般 常 用 一 个 含有 各 种 不 周 灰 庶 级 的 长 条 图 、 方 块 、 图 形 等 几何 图 案 
所 构成 的 标准 图 你 来 当 作 校正 的 基准 . 适当 的 校正 可 使 整个 亮度 范围 得 以 正常 显 
示 。 

号 低频 响应 ; 这 是 衡量 显示 系统 对 显 示 大 面积 相同 灰 度 的 能 力 , 这 个 因素 与 显示 点 的 样 
式 、 显 示 点 之 间 的 距离 以 及 干扰 大 小 与 位 置 有 关 。 

昌 高 频 响 应 : 这 可 用 来 表示 显示 系统 显示 精致 细节 部 分 的 能 力 。 
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1.4-5 记 有 对 


这 里 所 谓 的 记录 是 指 以 打印 或 其 他 “永久 ”性 呈现 图 像 的 方式 ， 有 别 于 先前 由 显示 设备 
所 呈现 的 图 像 在 电源 关闭 后 就 消失 的 状况 : . 
将 图 像 永 久 记 录 在 纸 上 或 软盘 上 的 装置 称 为 图 像 记 录 器 : 此 记录 器 一 般 采 用 下 列 技 
术 ; 
定 抖动 (dithering: 有 些 打印 技术 能 在 每 个 像素 上 打印 出 所 有 车 能 的 灰 麻 ， 有 些 则 只 能 
打印 昧 点 或 白 点 ( 即 不 打印 的 点 )。 后 者 柯 借 助 称 为 拉动 或 半 多 调 (halftone) 的 程序 来 
模拟 出 丰 同 灰 度 的 效果 , 其 概念 是 设计 出 大 小 甚至 样式 均 不 幅 同 的 黑 点 ， 然 后 对 于 较 
光亮 的 画面 就 用 较 小 的 点 . 较 墨 的 部 分 则 用 较 大 的 点 - 在 一 定 距 离 以 外 观看 其 打印 竺 
果 ,， 可 明显 感受 到 不 同 灰 度 的 效果 。 
名 彩色 打印 : 重建 图 像 所 用 的 是 三 种 色 料 ,分 别 是 吸收 红 光 的 蓝 绿色 (eyam， 吸收 绿 光 
的 茜 红 多 (magentalj， 以 及 吸收 藏 光 的 黄色 ， 此 三 种 颜色 简称 为 CMY 系统 . 理论 上 
等 量 的 蓝 绿 色 、 紫 红色 与 黄色 可 混合 成 墨色， 但 是 实际 上 因为 只 能 吸收 部 分 人 射 光 
线 ， 故 呈现 灰色 ， 此 种 混成 的 黑色 称 为 合成 妹 {fcomposite black)- 为 了 改善 此 现象 ， 
通常 采用 全 黑 的 第 四 种 颜料 而 形成 所 谓 的 CMYK 系统 。 


1.5 ”本 书 结 构 


本 书 共 分 两 大 部 分 ， 第 一 部 分 介绍 数字 图 像 处 理 的 原理 与 技术 第 二 部 分 则 是 与 其 搭配 
的 实习 教材 。 第 一 部 分 共计 十 章 ， 其 中 前 三 章 是 背景 基础 的 介绍 ， 第 四 到 第 七 章 是 典型 的 图 
像 处 理工 作 ， 最 后 三 音 则 与 图 像 分 析 有 关 。 以 下 赂 加 介绍 ， 

第 一 章 简介 : 介绍 数字 图 像 处 理 的 基本 概念 。 

第 二 章 数学 基础 : 提供 数字 图 像 处 理 常用 到 的 数学 基础 。 

第 三 章 取样 与 量化 : 图 像 数字 化 的 源 理 是 本 章 中 的 重点 。 

第 四 章 变换 法 : 介绍 基本 变换 的 原理 以 及 各 种 常见 的 图 像 变 换 。 

第 五 章 图 像 增 强 : 探讨 图 像 增 强 的 技术 。 

第 六 章 图 像 恢 复 : 说 明 图 像 恢复 的 原理 与 方法 ， 

第 七 章 图 像 压 缩 : 介绍 编码 原理 及 常用 的 图 像 压 缩 方法 - 

第 八 章 医 像 分 割 : 讨论 图 像 如 何 分 割 并 列举 各 种 图 像 分 割 的 方法 。 

第 九 章 表示 与 描述 : 图 像 如 何 有 效 描述 以 便 进 一 步 加 以 辨认 是 本 章 探 讨 重 点 - 

第 十 章 图 像 模式 识别 : 介绍 图 像 模式 识别 原理 以 及 各 类 办 识 的 方法 。 

除了 第 一 章 外 ， 其 余 每 章 均 在 第 二 部 分 配 有 以 Matlab 语言 写成 的 实习 教材 ， 包括 原理 、 
程序 范例 、 结 果 展 示 ， 讨论 以 及 动手 做 等 单元 供 读者 参考 使 用 。 所 有 相关 的 程序 范例 以 及 图 
像 文 件 都 放 在 所 附 的 光 夫 中 。 
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1.6 ”主要 参考 文献 





数字 图 像 处理 历 经 全 世界 学 者 大 量 研 究 的 结果 ， 其 著作 相当 丰富 ， 各 种 专著 或 期 刊 、 杂 
志 上 发 表 的 文章 不 计 其 数 。 此 外 ， 每 年 都 有 许多 相关 的 学 术 研 讨 会 议 ,例如 IEEE Internationai 
Conference on Image Processing， 在 国内 较 知 名 且 历 史 较 久 的 则 如 CVG 耿 (〈Cotmputer Vision， 
Graphics，and Image Processing) 会 说 ， 这 是 由 台湾 地 区 图 像 处 理 与 图 形 识别 学 会 所 主办 的 会 
为 方便 读者 查阅 ， 以 下 列 出 与 数字 图 像 处 理 有 关 的 主要 书籍 与 期 刊 。 


书 籍 


Rafael CC- Gonzalez atd Richard 卫 . Wood, Digital Imiage Proeessing, Addison-Wesley，1992. 
William 天, Pratt, Digital Image Processing, 2d ed., John Wiley 炙 Sons, 1991， 

并 enneth R ,Castlerman, Digital Image Processing, Prehtice-Hall， 1996. 

Anil .Jaim Fundamentals of Digital [Image Processing, Prentice-Hall， 1989. 

Jae S. Litm， Two-Dimensional Signal and Image Processing, Prentice-Hall, 1990， 

RR. Rosenfield and 和 .CC. Kak，Digital Picture Processing， 20d ed., vols, ] 设 2,， 上 CadeImic Press， 
1982. 


期 刊 


Appled Optics 

Coimputers in Biology and Medicine 

《omputer Vision, Graphics, and Image Processing 

Engineering 也 Medicine and Biology Magazine 

Electronlics LetteTs 

IEE Proceecding - Wision Image and Signal Processing 

IEEE TransactHons on Image Processing 

IEEE Jransactions On Pattern Analysis and Machine Intelligence 
IEEE Jransactiors on SigTnal Proeessin 才 

JEEE Jrafsactions On Comrmmunications 

IEEE jransactions on Medical lmaging 

IEEE jzransactions on Citcuilks and Systetms, Part 卫 : Analog and Digital Signal Processing 
IEEE Transactions on Circujits and Systems for Video Technology 
了 下 EE Traitsactions on Multimmedia 

IEEE Iransactions on Biomedical Emgineering 

]EEE Jransactions on In 名 rmation Jechhnology ip Biomedicine 
LEEE Transactions on Information Theory 


第 一 章 


IEEE Transactions on System Man, and Cybernetics 
Medical and Biological Engineering and Cotaputing 
Optical Engineering 

Patterm Recoghitior 

Pattern Recognition Letters 

Proceedings of the IEEE 

Signal Processing 

Signal Processing Magazine 

Signal Processing LetteTs 

Signal PrIocessing: Image Coimunication 
UltrasonicJImaging 


简介 
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本 章 将 讨论 在 数字 图 像 处 理 技术 中 较 常 用 到 的 一 些 数学 基础 。 由 于 图 像 通 常 由 二 维系 统 
来 做 描述 ， 甸 此 我 们 从 二 维 的 信和 号 与 系统 讨论 起 。 


2.1 信 号 


此 处 我 们 所 考虑 的 信号 为 离散 空间 (discrete-space) 信号 。 一 个 二 维 C-D) 离散 空间 依 号 
{ 亚 称 序列 (sequence) 为 一 个 具有 两 个 整数 变量 的 冰 数 。 例 如 ，xfm , 丈 ) 表示 一 个 定义 为 四 与 
及 所 有 整数 值 的 序列 。 需 注意 的 是 所 有 四 与 元 的 非 整数 值 所 造成 的 xf(m ,于 ) 梢 数值 并 非 为 
去 ,而 是 没有 定义 。 

菜 些 特定 序列 在 二 维 信号 处 理 中 扮演 重要 的 角色 ,， 这些 序 列 有 脉冲 (impulse) 序列 、 单 位 
阶 跃 (ste 和 序列 ， 指数 (expohential) 序列 、 可 分 离 (sepatable) 序列 及 周期 (petiodicy 序列 。 


蚀 脉冲 序列 
脉冲 【或 称 单位 取样 ) 序列 黄 6(m ,ma) 表示 ， 定 尺 为 


1， mm =P 一 0 


0， 其 他 情况 


一 个 二 维 序列 5 四, 六) ， 如 图 2.1-1 所 示 ， 它 与 一 维 信 和 号 处 理 中 的 脉冲 5m ,二 ) 扮演 相同 
的 角色 。 


5 -| (2.1-1) 


本 (nl 





图 2.11 脉冲 序列 50nya) 
任何 序列 x(m,m) 都 可 以 被 表示 成 时 延 脉 冲 的 线性 组 合 : 


X(， 一 二 一 6 人 Ti， 十 攻 十 工 0, 一 DG 二 
+ 一 DB 一 1 十 下 十 + 0 + 上 克 ) 
十 区 0 四 (OP 十 XLR 一 1，ma 十 和 
十 X( 一 1 HD6(a 二 1、7 一 二 + 0 D6(，m -了 
十 克 DG 人 一 1 Pa 一 了 十 
= 了 yx 和 6(m 一 站 可 一 ) (2.1 2) 
在 系统 分 析 中 gm) 的 表示 式 将 会 非常 有 用 。 
线 脉冲 构成 一 种 在 一 维 信号 中 不 存在 的 序列 类 别 ; 一 个 线 脉 冲 的 实例 为 如 图 2.1-2 所 示 
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的 二 维 序列 态 (z) ， 其 定义 为 


1， 四 = 


0， 其 他 情况 


背 2 


so)=5oo-| (2.1-3) 


6rfn 


如] 


2.1-2 线 脉 冲 Grtrn 


其 他 包括 态 (z) 及 访 ( 全 -有 ) 在 内 的 例子 ， 其 定 立 均 与 8 CO 类似。 枣 (人 ) 中 的 下 标 了 指出 
六 (mi ) 为 一 个 二 维 序列 ， 这 个 符号 是 用 来 避免 当 二 维 序列 为 一 单一 变量 的 王 数 时 产生 混 
诺 ， 例 如 : 如 果 设 有 下 标 了 了 ， 太 (1 ) 可 能 会 与 一 维 脉冲 上 (7 ) 混 请 。 


色 单位 阶 跃 序列 
单位 院 牙 序列 ， 表 示 为 工 而 , 玫 ) ， 其 定义 为 


序列 区 (加 ,加 ) 如 图 2.1-3 所 示 ， 它 与 立 ( 六 ,如 )》 有 下 列 的 关系 

xu = 袜 六 5 (2.1-5) 
或 者 

(mn = 一 am 一) 一 nn -DJ+am 一 ma 一 (2.1-6) 


部 分 单位 阶 拷 序列 在 一 维 空间 中 并 没有 类 似 的 部 分 。 如 图 2.1-4 所 示 为 二 维 序列 的 例子 
tr (1 ) 9 其 定 尽 为 


1 开关 人 


0， 其 他 情况 
其 他 例子 包括 如 (0 ) 与 革 (和 -二 ) ， 其 定 久 均 与 二 全) 相似 。 


zoom)=moo=| (2.1- 人 力 
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4 了 人 1 





克 1 





图 2.1-3 单位 阶 跃 序列 xn re) 画 2.1-4 单位 阶 跃 序列 ur 人 an) 
埋 指数 序列 
指数 序列 的 表示 形式 为 Xm,m)= 4a" 有" ， 它 对 于 系统 分 析 相 当 重 要 。 
es 可 分 离 序列 
一 个 二 维 序列 xm) 如 果 可 以 表示 为 
xm sm) = ago C.1-8) 


则 称 其 为 可 分 离 序列 。 此 时 Am ) 仅 为 机 的 函数 ， 且 gf) 仅 为 访 的 函数 。 虽 然 可 以 将 Am ) 
及 8() 视 为 二 维 序 列 , 但 将 其 视 为 一 维 序列 会 较为 方便 - 因此 , 我 们 使 用 记号 Am ) 及 80n ) 
而 非 六 人) 及 Br(m) = 

脉冲 序列 为 一 可 分 离 序列 ， 因 为 S(m ,六 ) 可 表示 为 


UN) = GO)G(a) (1 -9 


此 时 5(a) 下 50o) 为 一 维 脉 冲 。 单位 阶 暑 序列 Km) 亦 为 一 可 分 离 序列 因 xm ) 可 表示 
为 


Ha) 一 2 人 DMK ) (1-10) 


此 时 am) 及 ) 为 一 维 单 位 阶 妈 序 列 。 另 一 可 分 离 序 列 的 例子 为 apbs +p2 ， 可 以 写成 
(gm + 的 pm。 


@ 周期 序列 
如 果 xm ,ma) 满 足下 述 条 件 : 对 于 所 有 (mm, 轧 ) 而 言 
天 机 三 大 有 十 丰 m 瑟 2 十 二 11) 
则 称 xm,zm) 为 具有 周期 X xN. 的 周期 序列 ， 此 处 所 与 人 均 为 正 整数 。 例 如 ， 
叫 m + 人 | 为 一 具有 周期 2x4 的 周期 序列 ， 因 为 对 于 所 有 全) ， 
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cos 攻 + | =eos 必 +2)+ 人 | =eos 攻 + 目 & 上 a C.112) 


序列 costn, + 如 ) 并 非 具有 周期 性 ， 因 为 对 于 所 有 (四 , 癌 ) 而 言 ，cosfm + 半 ) 并 不 能 表示 为 
cos[(m + NM)+m1= cos[m + + 有 ]] 的 形式 ， 式 中 六 与 N 为 任意 非 零 整 数 。 


2.2 ”线性 与 线性 时 不 变 系统 


若 对 于 任何 给 定 的 输 人 而 言 都 具有 唯一 的 输出 ， 则 此 一 输 和 人 输出 的 关系 称 为 系统 。 一 个 
输 人 为 xm, ， 输 出 为 Xmm) 的 系统 了 表示 为 


若 ,及 )= 了 [mma]] (2.2-1) 


在 没有 任何 限制 的 状况 下 ， 描 述 一 个 系统 需要 一 个 完整 的 输 人 输出 关系 。 若 已 知 一 组 输 人 所 
对 应 的 系统 输出 ,通常 并 不 能 确 知 此 一 系统 对 另 一 组 输入 的 输出 为 何 。 但 若 加 人 线性 
(linearity) 与 时 不 变性 (shift invariance) 的 限制 时 ， 系 统 的 描述 可 太 大 简化 。 值 得 庆幸 的 是 ， 
实际 上 许多 系统 都 可 以 近似 为 线性 与 时 不 变性 。 

系统 的 线性 定义 为 


线性 所 Taxi (nm ) 二 Do 人 (0 且 aa() (2.2-2) 


区 处 TI (nm = 太 人 m) T[z(m 中 =J(0n,m)，a 与 思 为 任意 纯 量 常数 ，4 全 好 表示 
4 包含 妃 且 有 包含 4。 上 述 条 件 也 称 为 可 租 加 原理 (principle of sapermpositiom， 图 2.2-1 中 的 
线性 系统 及 图 2.2-2 中 的 非 线性 系统 可 以 说 明 上 述 概念 。 图 2.2-1 中 线性 系统 的 线性 以 及 图 
2.2-2 中 非 线性 系统 的 非 线性 均 可 用 (2,.2-2) 式 轻 易 地 验证 。 


zf) Ji 
(Ph {《 的 了 3 
ECtyma ) 
现下 = 了 [四 二 六 人 J 机 ,1 ] = 了 [xsma 甩 二 2 ,rm 
图 2.2-1 ”线性 时 不 变 系 统 实例 图 2.2-2 非 线性 时 不 变 系统 实例 


系统 的 时 订 变 性 或 称 空 不 变性 (space invariance) 定义 如 下 
时 不 变性 人 7[z(m 一 mm 一 下 加 = 了 mn 一 一 本) {2.2-31 
此 处 mi)= Txt 到 人] 且 本 及 加 为 整数 。 如 图 2.2-1 中 的 系统 并 非 时 不 变性 ， 因 为 


了 [5 一 玉 有 一 形 ? 有 三 区 一 现 ) 一 弄 2 183 人 .24) 
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且 
其 一 型 了 一 弄 四 二 天 一 现 半 2 一 弄 2) 有 人 一 mi 一 形 ?) 【2.2-5) 


而 如 图 2.2-2 中 的 系统 则 具有 时 不 变性 ， 因 为 


了 [xn 一 凡凡 一 六 = 六 一 珊 ) 玉 一 形 2) (2.2-0) 


JR 一 机 ,由 一 认 )= 关 ( 抽 一 本 ) 一 雯 )) (2.2-7) 


考 典 一 线性 系统 工 。 使 用 (2.1-2) 式 及 (2.2-2) 式 ， 我 们 可 以 将 输入 xm) 的 输出 
3 表示 为 


yu mm)= TIz(n , 刀 们 = 叶 多 xf 后 )50u -有 一) 


1 


= 之 2 ]J7[BCm 一 而 ,ma 一 直 (2.2-8) 

从 上 式 可 知 : 借助 系统 对 于 5(m mm) 及 其 时 延 mn 一 站 有 一 二 ) 的 响应 可 以 完整 地 摘 述 一 个 
线性 系统 的 特性 。 如 果 对 于 所 有 厂 与 护 的 整数 值 ，T[S0n 一 大 ,六 一 太 让 为 已 知 ， 则 对 应 于 
任意 输入 xftmsm) 的 线性 系统 输出 均 可 由 (2.2-8) 式 得 到 。 但 对 非 线 性 系统 而 言 ， 对 于 所 有 
贡 与 玉 的 整数 值 ， 若 TI5(n - 一 由 -所 )] 为 已 知 ， 则 当 输 入 xm) 为 28(mm) ， 
5(m DJ)+G(m -1m) ,或 是 其 他 许多 序列 时 .我 们 无 法 得 知 其 系统 输出 。 

如 果 对 一 线性 系统 7 加 上 时 不 变性 的 箱 外 限制 ， 则 系统 特性 将 可 更 进一步 简化 。 假 设 我 
们 将 输 人 为 Sm,mm) 的 系统 了 的 响应 以 大 mm ) 表示 为 


jimm)= 了 [5(m ma (2.2-9) 
则 从 (2.2-3) 式 玉 (2.2-9) 式 得 到 
有 Cn 一 而:ma 一 无) 荆 TTO(Cn 一 太 :ma 一 后 包 全 10) 


其 中 了 为 一 时 不 变 系 统 。 对 于 一 线性 时 不 变 (linear and shif-invariant，LSI) 系统 而 言 ， 人 异动 
(2.2-8) 式 及 (2.2-10) 式 可 得 其 输 人 输出 的 关系 为 


Jam)= Te 人]= 六 xz) 太 ) 有 -三 放 大) (2.2-11) 
上 式 由 脉冲 响应 &mm) 完整 地 描述 了 LSI 系统 的 特性 。 对 于 一 个 LSI 系统 而 言 ， 只 知 
jmsma) 便 可 确 知 任意 输入 时 的 输出 为 何 。 上 式 亦 被 称 为 郑 积 (convolutiom)。 
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2.3 着 积 


着 积 算 子 常 以 “* ” 素 示 ， 因 此 对 于 一 个 LSI 系统 ， 
其 下， 二 其 入 下 2 证 关 及) 


-之 之 hn 一 下 ,ma 一 护 ) (2.3-]) 
值得 注意 的 是 : 在 LSI 系统 中 扮演 重要 角色 的 脉冲 响应 Am ,到 ) ， 在 非 线性 系统 或 非 时 变 系 
统 中 失去 它 重 要 的 意义 。 

(2.3-1) 式 的 卷 积 可 几 图 形 法 求 值 。 其 步骤 如 下 : 

() 翻 折 : 将 站 二 ， 大 对 各 0.0) 翻 折 以 得 到 大 -5 一 无) 。 

(2) 称 位 : 将 乒 - 二 ,一 后 了 右 及 向 上 分 别称 动 罚 及 本 单位 ， 以 得 到 大 机 一 硬 , 一 丰 ) 。 

注意 : 若 辐 为 负 值 则 向 左 移动 ， 同 理 知 六 为 负 值 则 向 下 移动 。 

(3) 相 乘 : 将 允 F 与 大 机 一 无 ,二 ~ 态 ) 相 滋 得 到 乘积 序列 。 

人) 相 加 求 和 : 将 所 有 乘积 序列 相 加 以 得 到 (mm ) 。 

图 2.3-1 以 一 合子 说 明 上 述 步 又 。 


好 2 






KR 了 Am ) 


人 划 












人] 人) 
{a] 
各。 
(0 
有 
(CD 
人 
用 疝 一 后 用 一 后 ) 一 8 一 由 下 一 由 ) ny) 
人 DG) (3 0) 
上 (0 (3) (IO ( 习 “人 
了 四 








3 < 3 


如 





由 {B) 
2.3-1 将 两 序列 以 图 形 法 做 卷 积 的 例子 
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在 人 2.3- 式 中 的 卷 积 算 子 有 一 些 一 维 结果 的 直接 延伸 。 以 下 列举 一 些 较 重 要 的 结果 . 
交换 律 (ecommutativityy) 


XUH :12 ) 阅 了 (2 72 二 Js) 家 (3-2) 
结合 律 (associativity) 
[OOm ms) # 了 (7 四 克 生 7) = 区 肌 :m2》 汪 [Cn 7)*Z0 7 有 (2.33 
分 配 律 distributivity) 
区 (Pa 天 2 [J8 3 ) 十 2 8 中 二 于 (区 3 十 [CD ma 省 (2.3-4) 
与 时 延 脉 冲 的 卷 积 【cotvolution with shifted impulse) 
区 [了 i 主 椰 ( 和 一 玖 ， 玉 一 天 站 一 区 一 殉 | 一 其 让 忆 .3-4) 


交换 律令 述 了 当 输 入 与 脉冲 响应 互 换 角 色 时 ，LSI 系统 的 输出 并 不 受 影 响 ， 结 合 律 括 述 
了 两 个 脉冲 响应 为 丙 人 有) 及 玉 亿 :) 的 LSI 系统 串 接 时 ， 与 一 全 脉冲 响应 为 
邦 ( 人 7)*# 瑟 (的 工 SI 系统 具有 同样 的 输出 输入 关系 。 分 配 律 叙述 了 画 个 号 冲 响应 为 
矶 (0 及 记 人 的 LSI 系统 平行 结合 时 ， 与 一 个 脉冲 响应 为 志 (+ 瑟 人 ,地 ) 的 LSI 
系统 具有 同样 的 输出 输 人 关系 。 


2.4 和 插 阵 运算 
2.4-1 向 量 与 矩阵 
-- 维 或 二 维 序列 经 常用 向 量 或 矩阵 的 浓 式 表示 。 一 个 包含 Y 个 元 素 的 列 向 量 x 表 示 为 
xf 
x= fr 上 2 (2.4-1) 
MI 


问 量 zx 的 第 ”个 元 素 表示 成 xm ， 罗 ,或 [对 。 除 非 另外 指明 ,和 理 则 所 有 的 向 量 皆 为 列 向 量 。 
一 个 大 小 为 丈 的 列 向 量 称 为 一 个 Wx1 向量， 大 小 为 六 的 行 向 量 称 为 一 个 1x 向 量 。 
一 个 太 小 为 杂 x 丈 的 得 阵 4 具有 对 行 与 六 列 ， 定 义 为 


at at20 ad 


af2, 


4 = 怕 (m: 刀 上 乒 (2.4-2) 


adD ad al NI) 
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此 阵 4 中 第 普 行 及 第 m 列 的 元 素 可 写成 鸭 ] 。 ,= am 站 =as,s 妈 的 第 列表 示 成 四 ,其 第 挛 
个 元 素 写 成 w (mm) = at 站 。 当 和 矩阵 的 起 始 指标 不 是 (1 、]) 时 ， 我 们 以 如 下 方式 表示 

4= fa(m 品 | 0 反 玫 袜 六 一 上 (2.4-3) 


土 式 将 一 六 x 交 得 阵 以 起 始 指标 他， 由 重新 表示 。 
在 二 维 空间 中 ， 通 常 将 一 及 图 像 视 为 一 个 囊 阵 。 这 种 矩阵 表示 法 仅 是 将 传统 二 维 直 角 坐 
标 系 作 一 90* 的 顺 时 针 方向 旋转 


{a(m 由 = 





2.4-2 竹 阵 重要 的 术语 及 性 质 


在 此 假设 读者 对 线性 代数 有 初步 认识 ， 本 节 只 针对 图 像 处 理 上 较 常 用 的 部 分 做 重点 整 
理 。 
气 阵 4 的 转 置 表 为 4 ， 其 元 素 为 


[=e,。 (2.4-4) 
同 理 4 的 尼 米 特 (Hermitian) 转 置 (或 巷 转 置 ) 表示 为 4 或 4* ， 其 元 素 为 
[ar] 和 {2.4-9) 


若 疏 =4， 则 方形 第 阵 4 称 为 厄 米 特 的 。 
以 下 列举 一 些 扎 阵 的 共 恩 与 转 置 规则 
1. 4 =[4 
2、[.4 再 ] = 好 4 
和. [4 二 =[. 生 二 
4 1448] = 作 殖 ， 
二 矩阵 的 迹 (trace) 
一 个 Nx 和 方形 托 阵 4 的 迹 为 其 主 对 角 线 上 元 素 之 和 ， 表 示 成 


计 和 = at 站 (2.4-6) 
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若 4 和 怠 均 为 方形 矩阵 ， 则 
tk[L48] = tr[ 了 4] (2.4-7) 


龟 向 量 的 范 数 (notn) 
一 个 NxE 大 小 的 向 量 x 的 欧 几 里 擂 (Euclidean) 向 量 范 数 为 一 定义 如 下 的 纯 量 


=vxx (2.4-8) 
急 和 矩阵 的 范 数 
一 个 Xx 丰 大 小 的 矩阵 4 的 欧 几 里 德 算 阵 范 数 为 一 定义 如 二 的 纯 量 
| 让 = yeCd4) (2.4-9》 


鲁 托 阵 的 秩 frank) 

对 一 NxRN 的 些 阵 4. 若 其 最 大 的 非 夺 异 (nonsingulan 方形 子 矩 阵 为 尺 x 及 , 则 矩阵 几 的 
秩 为 只 。 它 也 等 于 线性 无 关 的 行 或 列 的 个 数 。 若 矩阵 4 及 如 为 非 奇 异 和 矩阵， 而 为 任意 矩 
阵 ， 则 


TankCCJ= Tank(dC)=TankfCd =Tank( .4KC 厂 ) (2.4-10) 
矩阵 4 及 如 之 屁 积 的 秩 满足 下 列 关系 
Iank( dd 下 ) 反 Iank(d) 
rang(4 吾 ) < rank(B) (2.4-1) 
矩阵 4 及 如 之 和 的 秩 则 有 如 下 关系 
Tank(4 二 好) 二 Tank(d (2.4-12) 
急 问 量 内 积 
Nxl 向 量 x 及 * 的 内 积 为 纯 量 
让 = 六 他,4-13》 
@@ 向 量 外 积 
好 xl 加 量 * 与 xl 向 量 z 的 外 积 为 -~ 矩阵 
如 =VI (2.4-14) 


甸 二 次 型 (quadratic toran 
一 个 六 xl 实数 向 量 x 的 二 次 型 定义 为 一 纯 量 
作 = xd (2.4-15) 
其 中 4 为 WxN 矩阵 。 通 常 4 选 定 为 一 对 称 物 阵 ， 
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2.4-3 玫 阵 实例 


久 Toeplitz 与 循环 矩阵 


Toseplitz 旗 阵 了 为 一 在 其 主要 及 次 要 对 角 线 上 咎 为 固定 元 素 的 矩阵 . 这 代表 元 素 #zz 门 仅 
由 严 ~ 于 这 个 差 来 决定 ， 亦 即 Ham, 可 = 必 。， 如 此 一 来 一 个 WxN 的 Toepiitz 插 阵 便 有 如 于 的 


形式 
如 厂 世 -w+ 
下 加 三 志 将 
丰 =| 直 、N 
NSS 
天 到 上 大 声 加 


且 异 助 C2 六 -个 元 素 亿 ,一 六 +1 扫 大 和 不 -下来 定义 。 
车 矩 阵 C 的 行 《 或 列 ) 为 前 一 行 ( 或 列 ) 的 循环 偏 移 ， 也 就 是 


0 Ci 2 由 CN-i 


cn- co、 台 en 
C=| : 、、 开 
| 1 
本 | 2 上 CAw-i Cn 
则 称 C 为 循环 (cireulant 矩阵 ， 广 意 到 吕 同 时 亦 为 Toeplitz 矩阵 ， 且 
cmp 如 一 mm modulon) 
量 正 变 友 人 么 正和 矩阵 
正 交 (orthogonal) 矩阵 定 尺 为 其 逆 矩 阵 等 于 其 转 置 乍 阵 ， 也 就 是 说 
若 
4 = 
或 
44= 4dT7 = 了 
册 4 为 正 交 - 
者 矩阵 的 道 官 阵 等 于 其 共 罗 和 矩阵， 则 称 其 为 么 正 funitarm) 矩阵 ， 也 就 是 说 
-1 一 
或 
.44 = 4 4= 了 了 


(2.4-16) 


(2.4-17] 


(2.4-19) 


(2.4-19) 


(2.4-20) 


(2.4-2 和 


(2.4-22) 
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一 实数 正 交 惩 阵 同时 地 是 么 正 扎 阵 ， 但 一 么 正 扎 阵 却 不 需 为 正 交 - 由 上 述 的 定 久 可知- - 
mx 克 么 正 具 阵 的 行 ( 或 列 ) 为 正 交 旦 在 一 交 维 向 量 空间 形成 一 组 标准 正 交 基 . 
鲁 恒 正 性 质 与 二 次 形式 

若 一 放 x 克 的 顾 米 特 扎 阵 4 的 二 次 形式 

口 =X dr，VxrzD (2.4-23) 

为 正 {>0) 或 非 负 会 从 ， 则 将 其 分 别称 为 正定 (pesitive definite)y 帮 半 正定 (positive 
setmiidefinite) 。 同 理 ， 当 吕 小 于 零 或 小 于 等 于 零 时 . 4 称 为 负 定 或 半 负 定 . 不 满足 上 述 条 件 
的 扎 阵 为 不 定 的 findefinite]。 

著 寻 为 一 对 称 正定 ( 非 负 ) 矩阵 ， 则 其 所 有 特征 值 刀 } 皆 为 正 ( 非 负 ) 数 旦 4 的 行列 式 值 
满足 下 列 不 等 式 





| 本 =T[， 所 TIeu 个 (2.4-24) 
@ 对 角形 式 
对 任意 龙 米 特 矩阵 员 都 存在 一 么 正 矩阵 省 ， 使 得 
古 开 史 历 = 皮 (2.4-2 引 ) 
此 处 4 为 一 包含 灵 的 特征 值 的 对 衣 (diagonal) 矩阵 ， 上 式 的 另 一 种 形式 为 
灵 币 = 入 4 (2.4-26) 
它 是 下 列 特征 值 方程 式 的 一 个 集合 . 
及 历 = 生硬 大 = 有 2 (2.4-27) 
其 中 切 扑 十 :分别 为 吕 的 特征 值 及 特征 向 量 。 
@ 分 块 矩阵 
矩阵 的 元 素 本 身 亦 为 矩阵 者 称 为 分 块 姬 阵 (blocg matrixj。 例 如 
站 
4 人 C.4-28) 
4 和 


当 分 抉 绪 构 为 Toeplitz ( 即 4 = 生 ，) 或 循环 ( 即 4 = dm -mmodo 由 时 ， 则 矩阵 4 分 别称 
为 分 块 Toeplitz 或 分 块 循环 . 此外,， 若 每 一 分 块 本 身 也 都 是 Toeplitz (或 循环 的 ]， 则 4 称 为 双 
重 分 块 Toeplie (或 双重 分 氛 循 环 )- 

分 妃 矩 阵 可 用 来 简化 许多 罚 像 处 理 中 的 分 析 工 作 。 例 如 ， 二 维 的 卷 积 就 可 用 简单 的 分 决 
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和 抵 阵 运算 达成 。 考 虑 先前 图 2.3-1 所 示 的 例子 ， 我 们 可 得 如 下 的 结果 ， 


多 0 吾 。 
?=| 攻 |=| 吾 五， | |- 严 (2.4-29) 

二 

pi LO 吾 | 














2 2 i 
其 中 浆 为 输出 ywum) 所 形成 的 列 向 量 ， 例 如 久 =| 3; =- 中 < 


-3 3 ] 
1 站 人 1 0 0 
-1 1 0 1 1 0 
五 = 0 -1 1 ， 瑟 = 0 1 让 由 (2.4-29) 式 可 看 出 吾 为 3x2 分 块 Toeplitz 年 
0 0 一 | 0 0 1 


阵 。 另 外 ， 当 有 周期 序列 做 二 维 的 卷 积 时 可 形成 分 块 循 环 矩 阵 ， 请 读者 自行 举例 - 


和 矩阵 直接 或 Kronecker 乘积 
一 个 好 x 玉 大 小 的 矩阵 4 与 Px2 大 小 的 所 阵 召 所 形成 的 右 直 接 乘 积 (direect producb) 为 
一 大 小 为 PMxew 且 定义 如 下 的 矩阵 ， 


ad.DB  … ea0 AM) 有 
C= 4 有 = 各 (mm 站 五 六 5 有 本 “人 0 (2.4-30) 
alM,DB aa,N) 且 


间 理 . 左 直接 乘积 刚 可 定义 成 C= 且 @4= fbfpg)4。 本 书 将 只 考虑 (2.4-30) 式 的 右 直 
接 乘 积 (以 下 简称 直接 乘积 )。 直 接 乘积 主要 用 来 从 较 小 的 矩阵 依循 环 的 方式 产生 较 大 的 矩 
阵 、 例 如 第 四 章 某 些 变换 的 基底 所 形成 的 矩阵 就 具有 这 种 关系 ， 其 功能 是 表达 一 个 较 大 图 像 
分 拨 的 变换 可 循环 分 解 成 较 小 但 运算 较 快 的 小 分 块 变换 

一 般 而 言 4@@ 召 关 下 四 4 。 考 虑 如 下 的 例子 


1 3 1 3 1 1 3 3 
2 4 2 4 -1 1 -3 3 
488=| -1 -3 1 3884-| 2 2 4 4 
-2 -4 2 4 -2 2 -4 4 
直接 乘积 有 下 列 性 质 ， 


1.《4+ 天 四 忆 = 计 四 C+ 丰 四 ; 
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(4 因 本 图 C= 4 四 ( 百 四 吕 : 
(4 久 有 =(C 从 因 吾 =4 人 到， 其 中 必 为 纯 量 ， 
(4 久 天 TI= 4 四 吾 5 
(4@ 玖 = 丰 ! 国 下" ; 
(4@BNCG@B=CdCB(BD) ; 
tr 四 有 =tr( 四 如 ( 吾 ) ; 
，Tank(4 久 召 ) =Tank(dD)rank( 如 ) ; 
. 铸 4 与 下 为 么 正 ， 由 4 名 吾 亦 是 : 
性 质 6 的 结果 对 于 发 展 含 矩阵 相 乘 的 快速 算法 很 有 有用， 因为 等 式 左 边 的 运算 量 为 
ON5TOUY4) 而 右 进 则 只 需 OUY4)( 设 辐 个 矩阵 的 大 小 均 为 RxN 小 


2.5 纯 量 值 对 向 量 参数 的 最 优化 


~] 人 上 hu 


在 图 像 处 理 与 许多 其 他 的 工程 问题 上 常 出 现 对 一 函数 求 最 优化 的 问题 ， 本 节 考 虑 此 问题 
的 数学 背景 : 没 了 为 实数 维 向 量 参数 x 的 纯 量 值 范 数 ， 即 /oo， 梯 庶 VYx 了 定义 为 下 列 侦 
导数 的 向 量 





Yx 了 一 | 87， (2.5-1) 








甚 中略 ，vxw 为 工 的 分 量 由 Vx 广 = 发 可 得 了 最 大 或 最 小 所 要 的 条 件 , 进而 得 到 最 佳 化 的 解 : 
若 / 为 向 量 内 积 六 =wx ， 其 中 ， 亦 为 实数 向 量 ， 则 很 容易 可 证 明 


VCTa=VuOrTOJ=， (2.5-2) 
同 理 ， 若 了 为 二 次 型 xz"4x ， 则 其 梯度 为 

Vu(xTr4z=(d+4T)zx (2.5-3) 
车 担 加 上 4 为 对 称 ， 册 

VarI4 区 =24x (2.5-4) 


e 有 条 件 限 制 的 最 优化 
假设 我 们 要 将 某 个 哨 数 /gox ,ze) 最 优化 ， 但 是 有 如 下 的 条 件 限制 


cf 二 (2.5-5) 
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直接 做 法 是 解 上 式 得 到 两 个 变量 二 及 x* 的 关系 ,例如 
和 二 号 ( {2.5-6] 
再 将 上 式 代 人 了 中 并 将 An ,go 力 最 优化 ， 现 在 这 个 问题 已 变 成 仅 售 单一 变量 旦 无 条 件 的 最 
优化 问题 .这 个 方法 对 某 些 简单 问题 可 能 有 效 ， 但 一 般 而 言 并 不 太 有 用 - 较 侍 的 解法 是 采用 
拉 格 妆 日 乘 数 法 {Lapgrange maltipliers)。 
首先 引信 一 个 拉 格 般 日 变量 点 并 形成 称 为 拉 格 朗 日 的 新 函数 
了 (Ta = EXE 二 CE) (2.5-7) 


这 样 做 是 要 将 一 个 含 两 变量 且 有 条 件 限制 的 最 优化 fconstrained optimizatiory 问题 转化 成 
合 三 个 变量 但 无 条 件 限 制 的 最 优化 问题 。 使 Zn ,最 优化 的 必要 条 件 为 


ar or De 

0 2.5-8 
gr gxi 9xi > 
9L BF 9c 

呈 -da9c_0 2.5-9 
gx 9x。 后 人 
9 

5 (2.5-D) 


(2.5-10) 正 是 原始 的 限制 : 因为 这 组 方程 式 使 上 最 优化 并 同时 强迫 ce 为 零 ,因而 矿 为 最 佳 , 同 
时 亦 满 足 条 件 限 制 。 

现在 将 此 问题 推广 成 实数 向 量变 量 x 并 假设 有 多 个 限制 。 例 如 有 两 个 条 件 ci(zx) = 0 及 
cz(z)=0， 财 其 拉 格 朗 日 的 函数 为 


了 (有 = Go0+Act+ 包 ca C.5-1) 
而 所 要 和 解 的 方程 式 变 成 
VE=Vuroo+AVYVac(O+TLYacs( CQ5-12 
让- (2.5-13) 
5 Go=0 (2.5-14) 
对 更 多 的 限制 则 可 依 此 类 推 。 
2.6 ”随机 信和 号 


本 节 将 讨论 措 述 图 像 信 叶 的 统计 特性 所 常 采用 的 度量 方式 。 假 设 读者 有 随机 变量 与 随机 
过 程 的 基本 概念 ， 此 处 只 对 图 像 处 理 较 相 关 的 部 分 做 简要 整理 。 
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一 个 天 小 天 xl1 的 随 要 向 量 x 的 平均 fmnean) 定义 为 





哆 1 
mx = 人 =| (2.6.1) 
几 
其 中 m 为 随机 变量 的 平均 。 其 相关 (coerrelation) 矩阵 定义 为 
BR =E{xx7 (2.6-2) 
其 中 第 大 行 第 ! 列 的 元 素 为 旭 | x xy }。 其 协 方差 (covariance) 矩阵 定义 为 
Ce = 丰 (-maxJx 一 mix C.6-3) 
其 中 些 抢 阵 的 元 素 为 
cu = 本 [Ge 一 mo 一 下 (2.6- 
且 
cu = 个 一 | 上 var[- ] 6 
= xx 的 方差 (variance) 
由 (2.6-2) 及 (2.6-3) 两 式 可 看 出 ， 相 关 年 阵 与 协 方差 答 阵 均 为 应 米 特 矩 阵 ， 亦 即 
Rxx= 员 xx， Cxx=Cxx (2.6-9 
此 外 这 两 个 矩阵 均 为 半 正 定 ; 换言之 ， 对 任 一 复数 向 量 &， 它 们 有 如 下 关系 
2 导 Cs0，eCuouez0 (2.6-7) 
且 
屁 sx 一 Crx 十 中 z 阳 并 (2.6-8) 


若 届 io = 灵 ir =0 ， 则 称 过 与 ?为 正 交 ， 此 时 刷 x+y = 吾 xx + 玉 ?y; 而 若 Cey=Cyx=0,， 则 
想 x 与 ?为 非 相关 (uncorrelated， 此 时 Cxry =Cxx+Cyy: 
@ 夯 变 量 高 斯 密度 函数 

一 个 实数 沿 斯 随机 浆 维 向 量 x 是 由 多 变量 (multivariate) 正 态 fnormal) 或 高 斯 密度 男 数 
所 描述 的 向 量 ， 此 密度 函数 为 


1 一旦， 
= 一 一 
Cnzlcaal 


此 函数 由 平均 向 量 ms 及 其 协 方差 矩阵 Cx x 可 完整 摘 述 。 


(2.6-9) 
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外 平稳 过 程 


对 一 个 随机 序列 xm ， 著 任何 部 分 序列 {efD,1isis 寻 与 其 平移 在 的 序列 
frG+mh Ts1< 对 对 任何 整数 m 与 上 而 言 都 有 相同 的 联合 密度 函数 ， 则 此 序列 为 狭义 平稳 
(strict-sense stationmary)。 若 


{xz(m 上 mm (0= 常 数 (2.6-10) 
(xz(bz 人 上 (站 = 六 人 大 一 站 (2.6-13) 
则 x(m 称 为 广义 (wide-sense) 平稳 。(2.6-11) 式 显示 {x(o} 的 协 方差 矩阵 为 Toeplitz 矩阵 
外 马尔 可 夫 过 程 _ 
对 一 随机 过 程 xm ， 若 条 件 概率 分 布 
Prfx 人 ex 一 jx 一 分 …] = Pifz(mlxGn 一 要 (一 玉 ] 交 (2.6-12) 
则 xm 称 为 马尔 可 去 了 (Markov- 下 或 p 阶 马尔 可 夫 过 程 。 换 言 之 , 若 “ 目 前 ” 
Da -PS ysa-H 已 知 ， 则 “过 去 ”fx(j 7J<a- 革 以 及 “未 来 ”fx 寺 为 独立 
的 。 一 个 马尔 可 夫 -1 序列 是 最 简单 也 最 常 被 使 用 的 过 程 ， 以 下 我 们 只 考虑 此 状况 : 
一 阶 平稳 马尔 可 夫 序列 xz 的 协 方差 画 数 为 rm = 4 ，|pl<1。 此 函数 常 作 为 单 色 狗 像 


一 列 像 素 的 协 方差 模型 。 对 一 全 WxIi 向 量 x={Tx0oh,1 反 sN}， 其 协 方差 矩阵 灵 为 
{rm = rn 一 及 ， 亦 即 


站 


亡 1 局 

玉 =| 所 (2.6-13) 
: 及 
胡 人 


此 为 Toeplitz 矩阵 。 事 实 上 任何 平稳 序列 的 协 方差 数 或 自 相 关 和 邱 阵 均 为 Toeplitz 矩阵 
外 马尔 可 夫 链 


当 xf9 只 有 可 数 的 (离散 ) 值 . 则 马尔 可 夫 过 程 称 为 马尔 可 夫 链 {chaim- 对 任何 数字 情 和 号 
处 理 (包括 数字 图像 ) 都 适用 马尔 可 夫 链 ， 因 为 其 随机 序列 都 是 以 有 限 个 离散 值 来 表示 的 。 
若 xXD 为 满足 下 列 条 件 的 随机 过 程 ， 则 xx 为 马尔 可 夫 链 


PIT 三 工 





xX(M 一 了 二 怀 s-19 Fa 力 三 翘 mg-28 了 
= PITxfm) = | 一 坊 =x (2.6-14) 


换言之 ， 现 在 发 生 的 事件 只 与 最 近 发 生 的 事件 有 关 。 以 下 是 有 关 马 尔 可 夫 链 的 重点 整理 : 假 
设 x 人 或 mm 的 可 能 值 有 中 个 分 别 表 成 SS 83。 。 当 xD=8 时 .我们 说 马尔 可 夫 链 在 状 
态 i ， 而 条 件 概率 
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Pi(D= Pfzm=Sza-D=S31 C.6-13) 


则 称 为 转移 (tansition) 概率 。 设 此 转移 概率 为 常数 ， 亦 即 与 = 无关 或 Pi(n = 已 , 、 则 称 此 概 
率 为 齐 次 (homaogeneous) 转移 概率 。 由 此 概率 所 构成 的 概率 矩阵 
有 P 


由 


卫 


坟 


已 


后 | 


也 


让 


王 


引 


己 = 忆 ， (2.6-16) 








或 是 其 转 革 矩阵 如 = : 再 加 上 初始 状态 概率 可 完整 描述 整个 马尔 可 夫 链 ， 其 中 矩阵 万 称 为 
转移 (概率 ) 矩阵 。 
大 阶 或 天 步 转移 概率 定 习 为 


Pi = PT 站 =3|r(r- 有 =8] {2.6-17) 


可 证 明天 或 刀 : 含 有 所 有 天 阶 概率 如 下 。 若 定义 
问 | (下 ) Pr[x 二 全 


=| 严 的- 3 (2.6-19) 
poltm| | Prfr(mJ= So] 

则 显然 

ai= 如 plz-]] (2.6-19) 
适 代 天 次 后 可 得 

王 四 = 开 nm -天 (2.6-20) 
比 外 

殖 5 = 万 ' 了 人 和， 0<7 < (2.6-21) 
故 

Pf = > POP， 0<T< 大 (2.6-22) 


此 即 Chapman-Kelmegorev 方程 式 - 

当 某 个 马尔 可 夫 链 的 转移 概率 满足 某 些 条 件 时 ， 此 马尔 可 夫 链 在 大 量 的 观察 (observatiom 
之 后 会 有 一 个 极限 性 质 。 考 虑 如 图 2.6-1 所 示 的 一 个 简单 双 状 态 马尔 可 夫 链 ， 几 个 天 值 的 天 
阶 转 移 概 率 的 结果 显示 于 表 2.6-1 中 。 由 表 中 看 出 ， 不 论 起 始 状态 为 何 ， 高 阶 转 移 概 率 都 会 
收 和 伍 到 一 个 定 值 。 由 (2.6-22]} 式 可 推 得 ， 此 过 程 会 达到 其 一 个 状态 的 概率 将 趋 近 于 一 个 定 值 。 
因此 该 过 程 从 起 始 状态 起 仅 有 “有 限 的 记忆 (imited inaemory)”。 
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0.25 
2、 
0.35 和 
0.5 


图 2.6-1 可 达成 极限 概率 的 简单 双 状 态 马尔 主 夫 链 
表 2.6-1 双 状 态 马 尔 可 夫 链 的 转移 概率 
































色 离散 随机 场 


当 二 维 序列 的 每 个 样本 点 都 是 随机 变量 时 ， 我 们 称 之 为 将 散 随机 场 (random field)。 先 
前 关于 一 维 随机 信和 号 的 探讨 都 可 推广 到 二 维 随机 场 - 
培 一 个 随机 场 的 协 方差 函数 可 写成 本 个 --- 维 序列 的 协 方差 冰 数 的 弱 积 ， 则 此 协 方差 冰 数 
称 为 可 分 离 的。 常用 于 图 像 处 理 中 的 一 个 可 分 高 平稳 协 方差 函数 为 
rz 二 全 = 站 本 7 人 门 =G 由 0， ol<bjp<l (2.6-231 


其 中 忧 -代表 随机 场 的 方差 数 ， 而 p, 与 ; 分 别 代表 大 方向 与 了 方向 坐标 差 一 个 像素 间 的 相关 
性 。 对 许多 图 像 而 言 ，Pi = P: =0.95 是 一 个 很 好 的 估 测 . 
另 一 个 被 认为 对 许多 图 像 而 言 更 实际 的 协 方差 函数 是 


Fr 下, 大门 = 可 exp|- Ja 优 一 系 肝 十 加 人 一 站 (2.6-24) 
当 和 内 =& = 好 时 ，xf 有 六 变 成 欧 几 里 德 距离 的 函数 ， 亦 即 
F( 天 让 门 = 加 2 (2.6-25) 





其 中 了 = 一 8 +fC- 门 ” 。 此 画 数 具有 各 向 同性 (fisotropic) 或 环形 对 称 (cireujatiy 
syrmimetric) 的 特性 。 


习 题 


1. 绘 出 下 列 序列 
(1) 安 (m 十 2 一 下 +26 人 fm 一 7 十 2) 
(2) 六 (JU 
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{3) 目 全) 十 天 TEN 一 由 十 一生) 
2 试 决定 下 列 系统 是 否 为 上) 线性; 人 时 不 变 。 
(1) Ja 二 了 [Xml Pi] 一 er 


C) pm)=T[z0n mi]= 六 xk) 


夺 =m -3 


G) ye)=TLzonsaD= xn) 


3. 试 计 算 下 列 二 题 的 xm ,rm )* Am nm) 
人 1) 


下 (Ra 一 中 (TD 





O) sum 人 | 全] wm 


所 下) 二 2 一 1 一切 
4， 验证 下 列 各 点 叙述 : 
(1) 一 个 循环 矩阵 为 一 Teeplitz 矩阵 ， 反 之 则 不 成 立 。 
(2) 两 个 循环 扯 阵 的 乘积 仍 为 一 循环 矩阵 。 
人) 两 个 Toeplitz 香 阵 的 乘积 不 一 定 为 Toeplitz 矩阵 。 
5. 试 以 图 解法 做 以 了 序列 的 卷 积 ; 
人 Cn) = (二 260 一 n+T2600 1 一 人 二 36 一 my 一 二 
ms 一 (mm 一 (一 1 二 Ga 一 十 200 本 一 1 一 二 
人 2) 区 mm) 有 (Pi 一 1 一 下 十 28 一 2.7 一 上 十 26(m 一 17 一 2) 十 36 人 (1 一 21 一 2 
RE NI) = 有 (7 十 有 (一 站 my 一 On 一 二 26 一 ,73 一 全 
6. 试 以 电脑 程序 验证 上 是 的 结果 。 
7. 说 4 为 实数 失 降 ， 若 其 固有 值 均 为 正 值 ， 则 4 为 正定 的 。 证 明 ， 当 且 仅 当 对 每 个 非 零 的 
向 量 x， 均 有 xT4x>0， 则 旭 为 正定 的 ， 其 中 


La 


AD 


il 
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. 试 决 定 以 下 矩阵 是 否 为 么 正 或 顾 米 特 怎 阵 ? 


五 厂 
(1) | 二 


0 人 


. 若 有 某 个 非 奇 异 和 矩阵 忆 使 得 PP 4PB = 吾 ， 则 4 相似 (similan 于 如 。 证 明 4 与 吾 有 相 园 的 


秩 


. 设 4 与 如 相似， 证 明 其 迹 会 相等 . 
, 设 4 为 可 对 角 化 的 六 x 交 夭 阵 。 证 明 : 其 中 有 大 小 为 wx 的 矩阵 如 , 瑟 …, 本 使 得 


(1) 本 = 用 站 十 已 瑟 二 二 机 天 ， 其 中 心 ,和 4. 为 4 的 国有 值 。 

CD) = 己 ， 其 中 六 =12…,N。 

G) 堵 天 =， 则 天 五 =@ (CNx 的 零 征 阵 )。 

(4) 下 十 书 二 + 严 , = 了 

[ 届 喇 二 元 瑟 + 和 有 称 为 妊 的 分 谱 分 解 (Spectral decomposition)， 而 矩阵 疡 称 为 投影 
(Projectiom)。] 

提示 : 先 确 定 对 某 个 有 天 " 4P = 历 .为 一 对 第 矩阵 。 将 五 写成 总 = 让 科 + 和 入 :+ 
hv ， 其 中 了 为 在 六 位 置 上 为 1、 其 他 位 置 上 均 为 徐 的 矩阵 。 


. 耸 一 简单 例子 显示 : 当 有 周期 序列 做 二 维 的 眷 积 时 可 形成 分 块 循环 矩阵 。 
. 取 两 张 16x16 大 小 的 图 像 数 据 或 两 个 同等 大 小 的 任意 矩阵 ， 以 电脑 程序 计算 其 直接 乘 





积 ， 并 验证 课文 内 容 所 列 有 关 直 接 乘 积 的 性 质 。 


. 考虑 下 列 函 数 的 极 值 的 问题 


(= 站 十 到 


其 限制 为 七 +2x: -1=0。 求 极 大 、 极 小 值 。 





. 证 明 一 不 相关 随机 变量 序列 的 协 方差 矩阵 为 对 角 和 矩阵 。 
- 证 明 实 数 平稳 周期 随机 序列 之 一 周期 所 形成 的 协 方差 矩阵 为 循环 的 。 
,对 下 列 双 状 态 马 尔 可 夫 链 做 出 类 似 表 2.6-! 的 结果 。 
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在 前 二 章 曾 提 及 , 一 幅 灰 度 图 像 ( 单 色 图 像 ) 可 看 成 是 一 个 二 维 的 连续 函数 ftx, 妇 ,其 亮 
度 为 位 置 坐标 (x, 7 的 连续 函数 。 而 一 个 数字 图 像 是 图 像 Atx, 在 空间 坐标 和 亮度 都 数字 化 
的 图 像 。 从 二 维 连 续 函 数 变 成 可 用 矩阵 表示 的 数字 图 像 , 牵涉 到 在 不 同 空间 位 置 到 出 函数 ( 厌 
度 ) 值 作为 样本 ， 并 用 一 组 整数 值 来 表示 这 些 样本 的 两 个 过 程 。 前 者 称 为 取样 ， 后 者 则 称 为 
量化 ， 两 者 统 称 为 数字 化 。 图 3.0-1 为 此 数字 化 过 程 ， 其 中 上 代表 取样 后 的 结果 ，m 与 z 代 
表 符 阵 中 的 位 置 ， 六 代表 量化 的 结果 。 


Fe 胃 万 gm 用 六 om 请 
人 本 ki 


3.0-1 图 像 数 字 化 的 商 大 过 程 


3.! 取 样 


取样 是 将 图 像 fx 力 输 入 计算 机 的 第 一 个 处 理 过 程 。 在 取样 过 程 中 一 个 重要 的 考虑 是 
80x,y) 的 取样 密度 应 当 多 大 ， 才 不 会 调 失 原 图 像 的 信息 。 不 漏 失信 息 而 能 完整 地 恢复 原 图 
像 是 对 取样 的 基本 要 求 。 本 节 所 讨论 的 取样 定理 将 提供 取样 所 应 遵循 的 准则 。 


3.1-1 均匀 撼 形 取样 


设 .Fo 们 为 一 个 有 限 带 宽 (bandlimited) 的 二 维 连 续 函 数 : 亦 即 其 傅立叶 变换 Fusyv) = 
-jz 有 下 列 性 质 
Fem=0， 国 > 而 ， 网 > (3.1-1) 


其 中 加 和 mm 分 别 表示 在 x 和 * 方向 上 的 截止 频率 - 换言之 ， 在 傅立叶 变换 域 中 ， 原 图 像 
jx D 妨 的 信息 集中 在 长 宽 为 zw 和 2wm 的 矩形 范围 内 的 区 域 尺 ， 如 图 3.1-1 (本 所 示 。 
另外 考虑 一 个 二 维 取样 函数 


8fY,7] 二 人 》 5-mAny 一 na 全 .1-2) 


阁 二 一 1 一 一 so 


它 是 请 * 方向 间隔 为 Ar . 语 ?方向 间隔 为 加 的 二 维 脉冲 数 序列 ， 如 图 3.1-1 (b) 所 示 . 


2 
" 》 


攻 下 六 
(a) 一 个 有 限 带宽 函数 在 uv 平面 上 的 区 域 刀 人 fb) 取样 函数 8 tx, 妨 
图 3.1-1 〈 待 续 ) 
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用 取样 函数 s(x 尹 对 Flx, 力 取样 ， 得 到 取样 图 像 (zx ， 此 函数 可 以 表示 成 强度 为 图 
像 取 样 点 灰 度 值 的 二 维 脉冲 函数 阵列 ， 亦 即 


六 (=sDJoJ= jrj)5C -mAny 一 nt) 


击 二 一 sa 用 本 一 ou 


= > >/ (AnnAyo 一 mArcy 一 nm (G.1-3) 


殉 一 一 用 二 一 


这 相当 于 是 对 于 Alx, 妇 以 矩形 点 阵 均 匀 取 料 ， 每 个 取样 位 置 在 z= mAxz，y = may 上 ， 其 中 


卫 ; 玫 二 站 ， 十 1， 士 2，…n 


现在 看 六 (xz, 太 的 频谱 已 人 站。 首先 推导 出 sx 好 的 情 立 叶 变换 式 Su 四 为 


Sm= 冯  》， cn (3.1-4) 


出 二 一 ae 同一 一 吓 


因为 关 ( 轨 =sc 妇 xz 六 ， 故 其 傅立叶 变换 式 已 公有 为 3 站 和 五 ( 相 的 卷 积 
情人 = 表态 人 =3s0r 人 AD = 从 * 王 人 人 


六 六 工 工 训 全 中 wm 上 |pa av- 
=- 上 志方 之 之 Cr mA 有 中 | ab- 站 doadp 


1 1 要 亲 1 1 
-二 坊 立 互 [了 lw-m 二 6- 证]ee-ar-pampg 
T 1 t 吕 
AAA 2 才 "二 | {3.1-3) 


人 .1-5) 式 显示 取样 后 图 像 Pfx, 妇 的 频谱 屎 fa 是 原来 六 xz 六 的 频谱 已 (us 人 分 别 沿 z 轴 和 和， 
钠 每 隔 一 和 六 就 复制 一 个 Fl 的 结果 ， 如 图 3.1-1(Gj 所 示 。 从 图 3.LI(G 中 可 以 看 出 ， 当 


民 | 


(cl 取样 贸 像 的 频谱 
图 3.1-{ 〈 续 ) 
Ar 太 满足 人 .1-1) 式 的 有 限 带 宽 条 件 ， 且 
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1 
-一 过 240 Ar 科 了 
Ar 9 0G.1-0) 


1 1 
总 20 7 


时 , 各 个 相 邻 的 区 域 刀 不 会 彼此 混 释 , 因而 可 以 用 一 个 理想 的 低 遂 滤 波 器 取出 一 个 完整 的 如 
使 原 信 号 /zx, 攻 不 失真 地 再 现 ， 这 就 是 二 维 取样 定理 . 

了 (人 门 仅仅 在 x=maxr,y=nmay 的 位 置 上 有 取样 值 ， 因 此 可 以 把 大 (及 改写 为 
丰 (om 。 大 (mm 亲 形 成 离散 的 阵列 ， 但 其 函数 什 仍 为 非 离散 的 实数 . 


3.1-2 其 他 取样 方法 


上 一 节 是 采用 空间 位 置 上 均匀 取样 使 得 取样 格 点 为 矩形 或 正方 形 的 方法 。 此 方法 容易 实 
现 ， 对 分 析 也 方便 。 但 是 对 于 非 矩形 有 限 带宽 的 信号 ， 采 用 非 矩 形 格 点 取样 通常 可 获得 较 佳 
的 取样 密度 (取样 点 数 /面积 )。 


鲁 取样 矩阵 
考虑 图 3.1-2 所 示 的 取样 格 点 ， 其 中 取样 点 位 置 可 写成 


昌国 因 | 
三 丽 十 搬 = myo 十 FT (3.1 -让 
中 LS [多 


其 中 疾 与 = 为 任意 整数 ,矩阵 玉 = 攻 ，w ] 称 为 取样 矩阵 。 





图 3.1-2 由 台 样 炖 阵 严 所 产生 的 取样 点 阵 


ar 有 0 
"| 辣 (3.1-8) 


车 取样 抢 阵 为 
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虽 其 取样 点 阵 为 如 图 3.1-3(9) 所 示 的 短 形 点 阵 ; 若 取样 矩阵 为 


-二 Ax Ax 

亿 = 2 2 (3.1-9) 
了 -工作 
V2 V2 


出 其 取样 点 阵 为 图 3.1-3 人 b) 所 示 的 非 矩形 点 阵 。 此 点 阵 中 的 点 三 视 为 置 于 某 些 六 角形 的 顶点 
及 中 心 的 位 置 。 





(a) 后 形 点 阵 fb) 六 角形 点 阵 
图 3.1-3 ”不同 取样 矩阵 所 产生 的 两 个 不 同 点 阵 


对 于 某 一 个 点 阵 ， 其 所 对 应 的 取样 矩阵 中 不 是 唯一 的 ; 换言之 ， 两 个 不 同 密 度 的 取样 竹 
阵 可 产生 相同 的 点 阵 。 


se 周期 矩阵 
车 存在 一 正 数 P， 使 得 一 个 -- 维 函数 KG) 满足 
FDI=FU -PE， 对 所 有 (3.1-10) 


对 所 有 整数 上 ， 则 我 们 说 此 画 数 为 周期 性 的 。 亦 即 我 们 将 原点 位 置物 到 成 的 整数 们 上. 仍 不 
改 其 函数 。 同 理 ， 对 于 浆 维 画 数 Ff(O) ， 若 


FF ， 对 所 有 吕 (3.1-11) 


对 所 有 整数 向 量 二 、 则 F) 为 周期 函数 。 其 中 矩阵 也 称 为 周期 叫 阵 。 
(3.1-5) 式 的 书 ( 人 站 为 一 周期 冰 数 ， 其 周期 托 阵 为 


了 = (3.1-12) 
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由 G.1-8) 式 及 G.1-12) 式 可 看 出 





BF = 卫 (3.1-13) 
其 中 五 为 2x2 的 单位 算 阵 。 一 般 而 言 ， 允 与 六 有 如 下 关系 
玖 = 从 站 7， 杞 = (3.1-14) 


@ 取样 密度 


考虑 一 个 由 典 与 办 及 其 位 移 所 构成 的 四 边 形 (如 图 3.1-2 所 示 )。 由 于 取样 点 数 与 四 边 形 的 
个 数 一 样 ， 因 此 每 单位 面积 的 取样 点 数 等 于 每 单位 面积 所 能 放 进去 的 四 边 形 个 数 。 因 为 
ldetp| (的 行列 式 绝对 值 ) 代表 四 边 形 面 积 ， 所 以 每 单位 面积 上 的 格 点 数 等 于 Jaetp| ， 因此 


取样 密度 P= G.1-15) 
已 知 一 有 限 带 宽 函 数 的 频 宽 范 围 和 取样 点 阵 模式 ， 则 有 一 使 其 取样 不 产生 混 释 的 最 小 取 
样 密度 p。 与 之 对 应 。 以 图 3.1-1 (ay 的 有 限 带 宽 范围 以 及 图 3.1-1 人 b) 的 取样 点 阵 模式 为 例 . 
其 取样 筷 阵 如 (3.1- 轩 式 ， 放 其 周期 矩阵 如 (3.1-12) 式 。 困 此 其 取样 密度 为 
1 1 
detpr| ArAy 


但 由 于 (3.1-6) 式 的 厄 制 ， 即 





p= (3.1-16) 


1 他 328 
一 洋 2200 
全 人.1-1 人 7 


1 
巡 2 


故 其 最 小 取样 密度 站 o 二 4220V0 吕 
对 于 =wmw=r( 即 圆 环 形 频谱 范围 ) 的 情况 ， 我 们 考虑 一 种 如 隐 3.1-4 所 示 的 六 角形 取 
样 方式 。 其 周期 矩阵 为 


区 = 的 一 2 (3.1-19) 


帮 天 


起 


图 3.1-4 广角 形 取样 
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由 (3.1-14) 式 可 知 其 取样 算 阵 为 


IE 1 1 1 





pt- -| 23 7 23 7 0G3.1-19) 
2 27 
故 其 最 小 取样 密度 
一 全 1 一 了 _ 
P。 (六 角形 )= 了 2vV3r (3.1-20) 


若 采用 和 插 形 点 阵 ， 则 其 最 小 取样 密度 为 


P (矩形 )= 4 (3.1-21) 
因此 





P (矩形 ) 47 
一 血 - 一 一 ~ = <1.15 3.1-22 
Du (六 角形 ) 。 237: 人 ) 


由 此 可 知 六 角形 取样 比 矩 形 取样 更 有 效率 1.15 悦 。 另 外 可 计算 


一 六 角 形 “一 * 
人 -2 =13.4% G.1-23) 
Li 玫 


这 表示 对 于 圆 环形 有 限 带 宽 信 和 号 而 言 ， 采 用 六 角形 格 点 取样 比 采 用 矩形 格 点 取样 可 减少 
13.4% 的 取样 点 数 。 


3.1-3 重 建 


图 像 的 重建 是 从 取样 图 像 六 (me 问 还原 到 连续 图 像 fx, 思 的 过 程 。 此 过 程 借 助 通过 空间 
滤波 带 或 者 空间 内 撒 来 完成 。 
用 一 个 理想 频率 响应 如 下 的 二 维 低 通 滤波 带 


1， 加 < 吧 且 网 <w 


豆 ( 妇 = (3.1-24) 
0， 其 他 
将 五 (wx 妨 与 下属 阅 相 乘 ， 便 可 取出 原来 的 Fe .经 反 变换 后 可 以 完整 地 得 到 ffx, 妇 
(= 人 .1-25) 
即 
Co 四 = 下 本 万 G 且 人 .1-26) 


其 中 x# 为 比例 因子 ， 此 处 拓 = AraAy 。 
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设 原 图 像 rz 六 的 信息 集中 在 长 和 宽 分 别 为 2w 和 2 的 矩形 范围 内 ， 旦 4x= 5 一 ， 


Ho 
] 
Ar =-- ， 见 
2Vn 则 
Kitx 力 =3-HaGe yj= Sin(2T8。 划 Sinf2TvoD) 
27PioX 2VY 
=8Sincf2TC0X] ， Sinc(2TV0y] (3.1-2 站 


把 (3.1-3) 和 (3.1-27) 式 代入 G3.1-26) 式 ， 则 有 


Je 中 =》 六 sinef2rw(z-o0]sinc[2mo0y 下] 


X_nAxrnayatw 一 mAr, 靖 -mayndcdp 
= 》 sine[27tto 人 zx 一 HAr]XSsinc[28vo(y -mnAPLFGnArnAy) (3.1-28) 


上 上 式 显示 重建 图 像 是 由 位 于 x= mAr，、y = may 上 的 许多 个 二 维 sinc 函数 加 权 求 和 的 结果 ， 而 
加 权 值 就 是 取样 图 像 的 值 。 

由 sinec 天 数 进行 图 像 重 建 可 以 得 到 理想 的 结果 , 但 是 sinc 函数 对 应 到 一 个 理想 的 丈 形 波 
省 器 ， 进 行内 搬 实 际 上 并 不 可 行 。 通 常 采 用 其 他 类 型 的 内 插 来 替代 sinc 函数 。 例 如 图 3.1-5 
所 示 的 几 个 函数 ， 其 中 (可 是 方形 卫 数 ， 可 得 到 零 阶 样本 内 捅 : 避 ) 是 三 角 毅 数 ， 可 得 到 一 阶 
样本 内 揪 (线性 内 播 ); (cj) 和 (由 是 由 方形 及 三 角形 函数 内 找 的 结果 。 


| LN 





fa) 方形 如 ) 三 
(o) 方 带 内 播 ( 零 阶 内 揪 ) { 风 三 角 带 内 揪 (一 阶 内 揪 ) 
图 3.1-5 ”内 揪 范 孝 
3.2 量 化 


如 辆 3.2-1 (a 所 示 .， 对 疼 像 A(x 几 取 样 后 、 得 到 取样 值 疡 - 广 (m 站 。 在 进 人 计算 机 前 ， 
上 还 需要 进行 量化 。 从 数学 的 角度 来 看 ， 所谓 量 化 事实 上 是 一 个 多 对 一 函数 的 映射 (mapping) 
关系 。 例 如 从 一 个 有 无 穷 多 个 可 能 数值 的 实数 范围 映射 到 有 限 个 整数 所 构成 的 范围 。 从 实现 
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的 角度 来 看 ， 就 是 把 样本 值 的 歌 值 范围 分 成 若干 个 区 间 ， 然 后 用 其 个 代表 值 代表 这 一 区 间 内 
所 有 可 能 的 值 ， 如 图 3.2-1 fp) 所 示 ， 其 中 (dei.dt] 为 一 个 区 间 ， 其 代表 值 为 ” - 





ta) 量化 器 的 输 大 及 输出 fb) 允 对 一 映射 冰 数 
图 3.2-{1 将 量化 器 视 为 数学 的 函数 映射 


为 便于 计算 机 的 储存， 一 般 常 将 取 值 范围 分 成 2 个 区 间 . 例如 妃 =6. 7，…、12， 分 别 
可 以 把 像素 的 灰 度 值 分 成 人 128，…，4 086 个 区 间 。 区 间 越 多 ， 则 由 已 量化 的 样本 值 ( 即 
计算 机 内 的 数字 图 像 ) 夭 复 的 实际 图 像 越 接近 原 图 像 ， 看 上 去 越 邻 人 满意 。 当 区 间 不 够 时 , 咎 
图 像 的 灰 庆 值 变 化 缓慢 的 区 域内 将 出 现 原 图 像 上 没有 的 仿 轮 廊 (和 lse contourj。 这 是 由 于 量化 
过 于 粗糙 ， 使 得 量化 噪声 过 大 所 致 。 这 种 伪 轮 订 有 可 能 妨害 我 们 从 图 俐 获取 真正 的 信息 .而 
令 人 无 法 接受 。 耻 愈 大 图 像 愈 精致 ， 也 愈 不 容易 有 盆 轮 廊 。 但 下 也 代表 储存 每 个 像素 所 需 的 
位 数 ， 因 此 中 但 大 也 代表 计算 机 的 储存 量 以 及 对 其 处 理 的 计算 量 都 大 增 。 因 为 人 眼 的 感官 系 
统 对 图 像 精 致 程度 的 需求 是 有 极限 的 、 因 此 任意 采取 很 大 的 吾 值 是 堂 无 必要 的 。 以 需求 较 高 
的 医学 图 像 而 言 ， 有 人 用 吾 = 12， 但 对 一 般 图 像 而 言 召 =8 已 足以 应 付 大 部 分 的 应 用 . 

最 简单 的 量化 方法 就 是 把 样本 值 的 整个 取信 范围 均匀 地 分 成 工 个 于 区 间 ， 此 邑 均匀 量化 
的 基本 概念 。 若 子 区 则 的 大 小 不 一 ， 则 得 到 非 均 匀 量 化 器 。 前 者 通常 用 于 样本 值 大 致 均匀 落 
在 整个 取 值 范围 内 时 ;后 者 对 样本 值 在 取 值 范 围 肉 出 现 机 会 不 均等 时 有 较 佳 的 表现 ， 所谓 较 
佳 是 指 在 同等 量化 区 间 (或 同等 位 元 ) 下 ， 非 均匀 量化 实际 引 人 的 量化 噪声 较 少 : 以 下 分 别 介 
绍 这 两 种 量化 方式 。 


3.2-1 均匀 量化 


设 取样 后 的 结果 为 了 = 了 (有 ，jEtadad]。 假 设 取样 值 在 (d,,3; ] 的 范围 内 有 相同 的 
出 现 机 会 ， 即 其 概率 密度 函数 py ( 门 = 常 数 严 现在 把 整个 取 值 范围 (au,a, ] 均匀 地 分 成 工 个 
于 区 向 (dd ]. 大 =12,… 江 .每 个 子 区 间 (a ,di] 对 应 到 一 个 定 值 ， 总 共有 工 个 定 值 ” - 
其 中 的 工 个 六 ,1 去 下 所 二 ， 称 为 重 构 {reconstructiom 层 ; 另外 还 有 他 +T 个 本 ，0 挟 大 去 工 
称 为 决策 (decisiom 边界 。 

整个 量化 的 规则 很 简单 ; 当 Fe (dg，,, 届 ] 时 ， 对 应 到 量化 值 


广 -= (3.2-]) 
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可 写成 
六 = =radei< 大 三友 0G.2-2) 
此 量化 造成 的 误差 为 
ec = 广 -7 (3.2-3) 
有 许多 /与 广 之 闻 的 失真 测度 方式 az(/ 方 ， 例 如 
4 为 =| 广 - 才 
。 、| 囊 辣 (3.2-4) 
zuU 访 = 作 - 





其 中 六 为 正 整 数 。 但 最 常用 的 却 是 
sf- 让 6 


量化 器 的 最 优化 设计 就 是 要 选取 四 与 六 使 某 个 了 与 广 之 间 的 失真 测度 最 小 化 ， 例 如 我 
们 可 选择 使 平均 失真 娓 最 小 


D=B[adr, 站 -三 sos,PDprUoan G2.9 


现在 分 析 采 用 上 3 失真 测度 时 均匀 量化 所 造成 的 误差 。 当 /es (d ,gt] 时 ， 取 样 值 量化 为 


了 = 天， 因而 有 误差 亿 一 门 。 在 Je (dd] 区 间 取 样 值 为 /的 概率 密度 是 p,( 记 ， 因 此 在 该 
区 间 内 所 造成 误差 平方 的 统计 平均 为 


太 C-APprUodhn 人 .2- 刀 
因为 (du,dj] 范 围 内 的 概率 密 庶 py (站 = 常数 P， 因 此 工 个 子 区 间 误 差 平方 的 总 生 为 
D= 过 | 人 Apr 这 六 和 -Ad 


-5 P2_[r 一 引 一 他 一 如 大] (3.2-8) 


要 取得 万 的 最 小 值 ， 故 取 52=0 ,最 


( 作 一 二 一 人 一 肥 =0， 1 和 天 扫 也 (3.2-9) 
香 此 得 到 最 佳 量化 值 


1 
路 = 了 (cr + 中) (3.2-10) 
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(3.2-10) 式 显示 若 取样 值 了 在 (中 ,4 ] 内 为 均匀 分 布 ， 则 量化 值 x 取 每 个 子 区 间 (df ,中 ] 的 中 
间 值 可 得 最 小 的 量化 误差 。 


设 子 区 间 (d， jd,] 的 长 度 为 4 ， 则 (G.2.3) 式 中 PP ， 此 时 我 们 有 


办 = 到 -dt G.2-11) 
将 此 式 代 人 (3.2-8) 式 中 得 

11 芝 |(4 -人 4 - 宇 . 

加 | 2 - 人 2 


由 此 可 见 ， 当 量化 区 间 数 也 加 大 时 ，A 成 比例 地 缩小 ,已 会 以 成 平方 反比 大 幅 缩小 。 因 此 加 
大 量化 区 间 的 数目 工 对 原 图 像 的 保 真 度 有 很 大 的 帮助 。 


3.2-2 非 均 匀 量 化 


当 概 率 密度 Pr( 门 不 再 是 常数 时 ， 非 均匀 量化 是 较 佳 的 选择 。 由 于 子 区 各 越 大 ， 造 成 的 
基 化 误差 就 越 大 ， 因 此 在 概率 密度 py 六 较 小 处 ， 可 取 较 大 的 量化 区 间 长 度 ; 反之 ， 则 取 较 
小 的 量化 区 则 ， 这 就 是 非 均匀 量化 的 基本 概念 。 以 下 推导 采用 e;3 失真 测度 的 非 均匀 量化 器 的 
好 与 耻 所 

同样 由 (3.2-7) 式 开始 ， 


D= 症 OZ-AerGoda 
= (5 一 大 六 Bra 态 + (ea -六 prid 十 …… (3.2-13) 


欲 得 人 .2-13) 式 中 忆 的 最 小 值 ， 故 求 厂 对 友和 六 的 偏 导 数 ， 并 令 其 为 0， 即 
9 姜 


3 = (mr 一 中 和 六 (at 一 (rt 一 如 Pras)=0 (人 .2-141 


其 中 大 = 2,…, 工 -1， 一 共有 工 - 1 个 式 子 , 此 处 四 和 于 是 已 知 的 , 不 必 对 它们 肯 求 贪 导数 : 
另外 令 


0 万 二 
于 = 中 一 护 jPPrUnid 六 = 人 .2 13 


其 中 下 = 上 2 …, 工 ， 一 共有 工 个 式 子 。 
若 Prtdjx0， 则 由 (3.2-14) 式 可 得 


人 一 一 (十 和 2 一 《3.2-16) 


工 
2 
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从 G.2-15 式 可 推导 出 


六 AprCaaA 
扰 二 一 二 一 一 一 
j 疡 Cd 天 


自 (3.2-16) 式 及 (3.2-17) 式 可 知 ， 最 佳 量化 器 的 各 子 区 间 决 策 边 界 刀 应 当 是 量化 重 构 层 准 值 
关 则 的 中 间 值 ， 且 每 一 个 关 是 了 落 在 子 区 间 (d as] 的 条 件 下 的 条 件 期 望 值 。(G3.2-16) 与 
G.2-17) 式 披 此 有 这 连 , 类 似 鸡 生 蛋 、 蛋 生 鸡 的 问题 ， 因 此 必须 采用 计算 机 的 数值 解法 求 出 @ 
和 去。 给 定 m 、d 、 疡 ( 门 .了 工 之 后 , 求 和 及 六 的 计算 机 解法 如 下 : 

(0 先 假定 一 个 = 的 值 ， 由 (3.2-1 刀 式 取 关 =1， 求 出 机 。 由 于 @ 是 积分 式 的 上 限 . 故 要 

采用 数值 近似 计算 ， 逐 步 逼 近 al 的 解 ; 

(7) 已 知 志 和 放 、 在 (3.2-16 式 中 取 大 =1 、 求 出 疡 : 

G) 由 机 和 琅 ， 在 0.2-17) 式 中 ， 取 大 =2 ， 用 数值 近似 计算 逐步 逼近 岂 的 解 ; 

f4) 由 嘱 和 P, 在 G2-16 式 中 ,， 取 让 =2， 求 出 。 


= 引 [Hsusd 直 -42 (2-17) 


人 AprCadaA 
G) 其 他 依 此 类 推 ， 最 终 求 出 产 ， 代 和 (3.2-17) 式 ， 看 其 是 否 等 于 一 一 一 一 一 : 如 
， 疡 rd 
果 不 相 等 ， 则 重新 假定 ” 章 ， 再 加 到 第 如 ) 步 . 继续 计算 求 出 疡 ， 直 到 产 符合 要 求 为 
正 。 
由 以 上 程序 所 得 的 景 化 器 称 为 最 佳 最 小 均 方 或 Lloyd-Max 量化 器 ， 其 中 与 图 像 处 理 最 相 
关 的 概率 密度 函数 为 





高 斯 : pr- o 串 -和 -] G.2-18) 
拉 普 拉 斯 : py( 记 = 与 exp(- ol- 败 ) G.2-19) 


其 中 在 与 骆 :分 别 代表 上 的 平均 与 方差 ， 拉 普 拉 斯 概率 密度 函数 的 方 盖 为 嫩 = 21e 。 
最 佳 均 方 误差 量化 器 有 几 个 性 质 : 
t. 量化 器 的 输出 是 输入 的 不 信 (anbiased) 佑 测 ， 即 


se (3.2.20) 
2. 量化 误差 对 量化 器 的 输出 为 正 辫 ， 亦 即 
8 站 站 0 (3.2.21) 


3. 若 引 与 六 分 别 为 零 平均 且 方 差 为 1 的 随机 变量 了 的 判决 层 与 重 构 层 ， 则 


弘 三 下 十 厅 引 ,六 三 下 十 加 (3.2-22) 
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分 别 为 与 有 相同 分 布 但 平均 为 岂 且 方差 为 oz 的 随机 变量 所 需要 的 判决 层 与 重 构 层 。 
以 上 性 质 的 证 明 当 作 习题 。 
如 果 ( 记 有 如 下 的 均匀 分 布 


1  ， 妈 所 三 三 纪 
五 六 站 = 全 一 do (3.2-23) 
0， 其 他 情况 况 





则 由 (3.2-17) 式 可 得 


1 
了 (de 一 di ) 1 


天 7 十 色 ) (3.2-24) 
叉 由 人 .2-16) 式 ， 我 们 有 

二 = 了 十 天 1 (3.2-25) 
结合 G.2-24) 与 (3.2-25) 两 式 可 得 

1| 1 ] 

从 -让 人 十 二 闭 本 (Ge 十 起 ) 6229) 
化 简 上 式 得 到 

起 = 了 十 dj (3.2-27) 
由 (3.2-27) 式 可 推出 

eta =da- 吧 =4 (常数 ) (3.2-28) 
同 理由 (3.2-24) 式 亦 可 推 得 ， 


1 1 
Fl 一 下 (den das 二 人 = 了 (di 一 二 对 { 常 煞 ) (3.2-29) 


以 上 说 明 当 输 人 值 有 均匀 概率 密度 男 数 时 ， 非 均 习 量化 已 晓 变 为 均匀 量化 ， 因 此 均 习 量化 可 
视 为 非 均匀 量化 的 一 个 特例 。 
对 于 上 述 均匀 量化 器 ， 其 误差 
eo = 广 -了 (3.2-30) 


均匀 分 布 在 - 孝 ~ 生 之 间 ， 因 此 其 均 方 误差 为 


三 。 _ 工 ?de _A = 
D= 中 le] 5 = 下 G.2.31) 
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正如 所 料 ， 与 3.2.12) 式 的 结果 一 样 。 
我 们 知道 对 一 个 均匀 分 布 的 随机 变量 ， 若 其 范围 为 4 时 其 方差 o? = 兮 。 对 于 用 位 的 
均 多 量化 器 ， 我 人 有 4= 坊 。 因此 其 信 噪 比 (SNR 为 


了 一 立 
瑟 - 基 =( 二 228 (3.2-32) 


以 分 员 (dB) 计 ， 则 
SNR=10log22 =68(dB) (3.2-33) 
因此 对 于 均匀 分 布 的 最 佳 均 方 误差 量化 器 所 能 获得 的 信 咯 比 是 每 一 位 约 有 6 dB 的 增益 。 


3.2-3 于 缩 扩展 型 量化 器 


一 个 压缩 扩展 器 (cotmpbander) 是 由 一 个 称 为 压缩 问 (compressom ， 加 上 一 个 均匀 量化 器 ， 
以 及 一 个 扩展 器 (expanden 所 形成 ， 奶 图 3.2-2 所 示 。 所 谓 压 各 与 扩展 是 指 对 输出 人 信号 的 动 
态 范 围 而 言 。 整 个 压缩 扩展 器 具有 非 均匀 量化 的 功能 ， 此 功能 来 自 竹 压缩 器 与 扩展 器 这 两 个 
非 线性 变换 画 数 。 


号 





图 3.2-2 ”一 个 压缩 扩展 型 量 作 器 
在 压缩 扩展 型 量化 器 中 ,首先 做 一 非 线性 变 摘 ， 即 
8=T{ (G.2-34) 


使 变换 后 的 结果 8 的 概率 密度 函数 p。(8) 接 近 均 匀 的 ， 然 后 进行 3.2-1 节 所 讨论 的 均匀 量化 。 
由 藕 均 匀 量 化 器 对 有 均匀 密度 函数 的 输 和 而 言 为 最 佳 ， 因 此 压缩 器 应 使 非 均匀 概率 分 布 的 输 
八 尽 可 能 变 成 均匀 分 布 的 输出 。 最 后 扩展 器 再 执行 另 一 个 非 线性 的 道 变换 函数 ， 寻 
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J 了 =Tm fs 03.2-35) 

最 后 得 到 量化 输出 广 。 
车 
一] 内科 县 坟 2 _ 

| 其 他 情况 (3.2-36) 
且 若 太 为 一 零 平 均 的 随机 变量 ， 则 一 个 适当 的 变换 为 

g=T{7= 太 mdAm -2 G.2.37) 
亦 即 非 线性 变换 郴 数 相当 于 三 的 累积 概率 分 布 。 例 如 对 雷 利 【Rayleigbm) 概率 密度 函数 

下 门 -去 o 叫 - 志 : ] (3.2-38) 
我 们 可 求 得 其 正 变 换 为 

8 - 叫 - 亏 5 ] (3.2-39) 
而 其 芭 变 换 为 


“本 on 


3.3 向 量 量化 


对 所 谓 无 记忆 (memoryless) 的 信息 源 而 言 ， 我 们 是 把 信号 的 各 个 取样 值 都 视 为 工 不 相关 彼 
此 独立 ,此 时 上 两 节 所 讨论 的 均匀 量化 与 非 均匀 量化 对 个 别 职 样 点 逐 点 量化 的 过 程 是 合理 的 做 
法 。 但 是 大 多 数 实际 信和 号 各 取样 值 之 间 存 在 有 相关 性 ， 亦 奴 知 道 某 个 取样 值 的 参数 ， 对 其 邻近 
取样 值 亦 可 做 合理 排 测 . 由 此 观念 所 衡 生 的 量化 方法 称 为 向 醒 量 化 (vector quantizatiomnVQ), 亦 
名 把 若干 取样 值 集 合成 一 个 向 量 ， 以 此 向 量 为 量化 的 单位 而 不 是 以 一 个 取样 点 为 单位 。 相 对 于 
VQ,， 前 二 节 所 述 有 李 点 量化 的 过 程 称 为 纯 量 量化 (scalar quantizatiom SQ)。 

设 耻 =[, 记 ,… 凡 二 表示 一 到 维 向 量 它 是 由 浆 个 实数 连续 纯 量 值 才 所 组 成 在 VQ 中 ， 
了 将 被 映射 到 另 一 个 六 维 向 量 = [mp 并。 的 VQ 是 将 一 个 闪 维 向 量 空 间 分 割 成 工 个 
决策 区 域 CC、1<5S 民 ， 每 一 个 决策 区 域 包 围 一 个 重建 向 量 r* 。 在 编码 的 文献 中 常 将 F 称 为 
码 向 量 (codevectory， 并 将 码 向 量 所 形成 的 集合 称 为 码 本 {codebook)j。 

设 声 代表 量化 的 结果 ， 则 可 写成 


只 


了 =YQUD=F， 了 EC (3.3-1 
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其 中 VQ 代表 向 量 量化 的 操作 。 
与 SQ 的 情形 一 样 ， 我 们 可 定义 一 个 失真 测度 4(/, 力 。 一 个 常用 的 da(7, 访 是 ere ,其 
中 量化 误差 ev 定义 为 


eu =- 让 G.3-2) 


重建 向 量 以 及 决策 区 域 C 的 边界 可 由 使 某 个 失真 量 最 小 化 来 决定 ,例如 采用 平均 失真 局 = 
可 CC1, 门 ]-. 若 世 六 为 epoeo ， 则 由 (3.3-0 及 0.3-2) 两 式 可 得 
刀 = 二 [ereo] 
= 如 -门下 - 门 ] 
= 厂矿 这-=JFTG-FprOodA 


=j CC-AT-A)prR)aR (3.3.3) 
取 SC -0 可 得 
97 
| -六 pyrUnd 大 =0 (G.3-4) 
将 上 式 重新 整理 后 得 
| 7prGpd 
四 G3.3) 
=E{rlFrsc 


对 于 一 个 固定 决策 区 间 的 分 析 ， 要 决定 最 佳 的 重建 向 量 z" 必须 知道 联合 概率 密度 
史 i 门 。 但 是 这 个 信息 在 实际 问题 中 往往 并 不 可 知 。 此 外 ， 计 算 G.3-5) 式 求 x 也 有 实际 上 的 
困难 . 此 图 难 随 着 问 量 维度 的 增加 而 加 大 。 

基本 上 设计 最 佳 z 所 形成 的 码 本 是 一 个 高 度 非 线性 的 问题 。 一 般 而 言 采 取 的 解决 方案 是 
利用 以 下 两 个 必要 条 件 

1. 最 近 上 距离 条 件 

输入 讯号 向量 包 使 其 对 应 的 代表 向 量 = 的 选择 应 满足 


人 六) 生 引 六) W G-3-0) 


则 称 此 不 等 式 为 使 平均 失真 度 测 度 为 最 小 的 最 近 E 离 条 件 : 
2. 中 心 条 件 
每 个 重建 向 量 n 必须 使 C 中 的 平均 先 走 最 小 、 亦 即将 


ELa( 0 了 EC G.3- 仿 
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对 ”最 小 化 。 满 足 (3.3-7) 式 的 向 量 ” 称 为 已 的 重心 (centroid)。 


以 上 两 个 条 件 可 弛 [出 一 个 设计 最 佳 碍 本 的 迭代 过 程 。 首 先 给 一 个 上 的 初 舍 值 ， 理 论 上 可 
将 所 有 可 能 的 了 上代 人 (3.3-6) 式 的 条 件 中 找到 C 的 佑 测 。 给 了 已 的 估 测 后 ， 计 算 (3.3-7) 式 的 
条 件 中 的 重心 以 得 = ， 以 此 了 作为 一 新 佑 调 值 重复 上 述 拘 作 。 这 个 过 程 有 两 个 实际 的 问题 : 
首先 ， 需 要 所 有 可 能 的 了 以 决定 Co 其 次 ,计算 忆 的 重心 所 和 需 的 py( 廊 一 般 也 不 可 得 . 实际 
上 只 有 某 些 与 我 们 要 做 向 基 量 化 近似 的 所 谓 ' 训 莓 向 量 "， 因 此 有 人 将 上 述 的 迭代 程序 修 改 成 
天 -平均 KE-meam 算法 ， 此 处 天 等 于 码 本 大 小 或 代表 向 量 r 的 个 数 工 : 

才 - 平 均 法 的 纯 量 版 本 (向 量 维度 为 一 ) 由 Lloyd 于 1957 年 提出 ，Forgy 在 1965 年 提 到 变 
成 一 般 向 重量 化 的 状况 (Forgy [1965])。 此 方法 又 称 LBG 算法 ， 这 是 因为 Linde、Buzo 与 Gray 
三 人 在 1980 年 所 发 表 的 一 篇 论文 中 详 论 VQ 码 本 的 设计 (Linde at al. [1980])。 以 下 是 LBG 算 
法 的 步骤 。 

() 初始 化 ; 定 出 码 本 大 小 工 、 失 真 临 界 值 8, 初始 码 本 如 = fo 1 Si 至 了 及 训练 序列 

7T= [Fi ac=12 NAN>zL。 设 选 代 次 数 普 =0， 初 始 失 真 万 .= 吓 - 

(2) 对 码 本 Rs = {mrmi 1 到 1 下， 找 出 训练 序列 了 的 最 小 误差 分 制 ， 即 若 


三 万 ， 下 mr) 友 碟 凡 ， 到 mh 呈 天 


财 所 所 总 六 
G) 计算 平均 失真 


1 这 ， 
D.- = 方 之 RdUnn) 


若 (Di -DajDn 去 E、 则 输出 碍 本 Rs， 退 出 选 代 过 程 ;， 否 则 继续 。 
( 没 属于 Ci 的 向 量 有 邓 , 个 ， 则 新 估 测 的 ”是 使 


1 
太 外 <) 
最 小 的 值 。 车 40 站 = (站 (FF 站， 即 平方 误差 ， 则 = 正 是 好 个 向 量 的 算术 平 
均值 。 
全 ) 取 严 = 由 +1， 回 到 步 又 C2)。 
以 上 过 程 用 Matlab 程序 写成 ， 列 于 第 三 章 实习 的 程序 范例 中 。 踪 了 LBG 算法 之 外 ， 还 
有 许多 VQ 的 设计 方法 ， 例 如 人 工 神经 网 络 中 的 自 组 织 (self-organization) 映射 以 及 措 拟 退火 
fsimulated annealing) 等 。 
有 关 VQ 的 研究 目前 朝 儿 个 方向 在 进行 ， 
人 训练 序列 与 长 度 的 选择 。 
他 失真 测度 的 选择 。 
仿 改进 最 佳 分 割 远 代 的 收敛 速度 。 
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忆 


6. 


了 7. 


8. 


出 缩短 最 佳 向 量 的 比 对 时 间 . 

怨 减少 码 本 大 小 。 

地 发 展 自 通 性 得 本 以 扩 太 通用 性 . 

。o 发 展 多 级 残余 向量 量化 . 

地 与 其 他 方法 结合 :例如 与 第 四 章 中 讨论 到 的 小 波 变 换 . 

1996 年 2 月 的 IEEE Transactions on Image Processing 是 专门 讨论 VQ 的 专刊 、 值 得 参考 . 


习 题 


, 设 一 区 像 信号 为 1fz, 放 =4cos4rrcos6rm 以 Ar=ay=05 与 Ac= 如 = 和 2 分 别 做 取样 - 


采用 的 重建 让 和 为 - 堆 上 颊 守 | > Ar 人 和 的 人 E 泪 让 试问 两 种 情况 下 的 重 
建 图 像 分 别 为 何 ? 


. 将 一 个 以 8 位 表示 每 一 个 像素 的 灰 度 图 像 分 别 改 以 2. 4、6 丰 元 均匀 量化 器 输出 图 像 并 比 


较 其 结果 。 


. 设 一 图 像 函 数 Fo 站 = 255e--7reocs5， 其 中 四 与 m 为 固定 常数 。 若 将 此 函数 以 a 位 


将 其 数字 化 并 假设 当 两 相 邻 像素 的 灰 度 值 在 8 以 上 时 人 了 眼 能 感受 到 其 差异 。 试问 4 取 驳 少 
时 会 感受 到 伪 轩 廓 ? 


. 证 明 3.2 节 所 列 最 佳 均 方 误差 量化 器 的 三 个 性 质 : 
. 假设 我 们 要 用 固定 位 数 忠 对 纯 量 量化 后 的 六 个 纯 量 编码 ,其 中 第 个 纯 量 上 分 配 到 的 位 数 


为 如 邯 瑟 = 立 ， 其 最 佳 位 配置 的 策略 取决 于 所 用 的 失真 测度 及 纯 量 的 概率 密度 函数 : 


通常 对 于 协 方 莽 较 大 的 纯 量 会 分 配 较 多 之 位 数 ， 反 之 则 获得 较 少 位 数 。 假 设 除 方差 外 ， 所 
有 纯 量 的 概率 密度 函数 都 一 样 , 旦 都 采用 如 Lloyd-Max 等 同一 种 量化 器 ， 则 一 个 位 数 配 置 
的 近似 解 为 





其 中 心 * 为 上 的 方 盖 。 试 计算 每 个 纯 量 矿 的 重 构 层 个 数 亏 。 此 个 数 与 of 有 何 关 系 ? 

向 量 量化 较 纯 量 量 化 的 表现 为 佳 是 因为 前 者 利用 纯 量 间 彼 此 的 统计 相关 性 以 及 维度 大 
小 ， 试 举例 分 别 说 明 这 两 种 情况 。 

修改 第 三 章 实习 3,1 节 所 附 的 程序 范例 ,对 均匀 、 拉 普 拉 斯 及 雷 利 概率 密度 函数 的 情况 ， 
重 做 该 范例 。 

将 LBG 算法 用 在 一 图 像 上 ， 以 获得 向 量 维度 为 16， 且 码 本 大 小 为 256 码 本 。 显 示 量 化 前 
( 即 原 图 像 ) 后 两 图 像 ， 评 述 其 图 像 品质 的 差 曾 。 


离散 正弦 变换 pp 
Walsh-Hadamard 变换 


Haar 变换 
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由 于 图 像 上 的 某 些 阿 题 在 原 函 数 定义 的 领域 内 较 不 易 甚 至 是 无 法 解决 ,所 以 借助 某 一 个 
变换 法 将 其 变换 到 另 一 领域 ， 使 得 问题 较 易 处 理 。 一 般 而 言 ， 我 们 希望 变换 具有 以 下 三 种 特 
性 : 

1. 图 像 崔 像素 间 的 相关 性 要 降低 

也 就 是 说 将 最 大 部 分 的 能 重 集中 在 最 少数 的 变换 系数 上 ， 使 得 像素 间 的 信息 元 余 性 能 够 
去 除 。 

2. 与 图 像 无 关 的 基底 函数 

不 同 的 图 像 其 统计 特性 通常 也 不 同 ， 而 所 谓 最 佳 的 变换 与 图 像 的 统计 特性 有 关 ， 因 此 最 
佳 变换 通常 随 荐 图 像 的 不 同 而 有 异 。 由 于 要 找 出 最 佳 变换 的 基底 函数 非常 耗 时 ， 尤 其 是 当 图 
像 方块 本 身 就 属 非 平 稳 的 时 候 。 每 个 方块 各 有 自己 需要 的 基底 函数 羽 达 到 去 除 其 相关 性 的 目 
的 ， 因 此 需要 大 量 的 计算 。 此 外 若 岂 变换 法 做 数据 压缩 ( 见 第 七 章 )、 则 各 个 方块 的 基 净 函数 
必须 送 至 解码 端 ， 数 据 压 缩 效 率 会 降低 很 多 。 因 此 ， 通常 会 舍弃 最 优化 的 变换 而 采用 与 图 像 
无 关 的 基底 函数 。 

3. 快速 完成 变换 

对 于 N 点 的 变换 ， 所 需 的 计算 量 一 般 为 O (Y) 的 等 级 ， 有 些 变换 有 较 快速 的 算法 能 减少 
计算 量 ， 使 其 降 为 如 (NIlog, N 的 等 级 ， 因 此 对 一 个 wx 六 的 二 维 变换 ， 若 采取 依 序 做 列 再 
做 行 的 一 维 变换 方式 ， 其 所 需 的 计算 量 约 为 如 CN” log: N) 而 非 CCY“ ) 的 等 级 。 


4.1 正 交 变换 
由 一 般 序列 的 正 交 变换 可 直接 延 伟 到 一 个 对 六 x 六 图 像 Am 六 的 正 交 变换 
FED= 王 Jo al 人， 0 扫 嫩 过 六 -1 (4.1-1) 
/on 由 = 写 写 PC 站， 0 生出 天生 六 一] (4.1-2) 


其 中 {e (oonmj} 称 为 图 像 变换 基底 ， 是 完整 正 交 离散 基底 函数 的 集合 ， 进 集合 满足 以 下 性 质 ， 
1. 规范 正 交 性 (Drthonopmajlity) 


和 -1] 入 -1 


之 之 oo 人 有 ro=5- 纪 1 站 (4.1-3) 


枫 = 和 0 9 


2. 完备 性 (Cotmmpleteness) 


由 一 1 放 一 ! 


》 am 站 ar)=6m mon 一 nm (4.1-4 
元 素 FE, 门 称 做 变换 系数 ， 而 {F(5D} 称 为 变换 图 像 ， 其 规范 正 交 性 质保 证 任何 被 截 短 的 部 
分 和 
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太 有 = 呈 人 FEDartm 由 反 用, 电 所 有 (4.1-5) 
的 下 列 平 方 误差 
:之 On-7eonm (41-6) ， 


在 系数 互 (二 站 如 (4.1-1) 式 所 示 时 为 最 小 , 且 当 忆 = 台 = 时， 该 性 质保 证 上 述 最 小 平方 误差 
为 零 。 
@@ 可 分 离 么 正 变换 (Separable Unitary Transforms) 

一 个 可 分 离 变 换 的 条 件 为 


al (ob 由 = 全 (入 (加 二 aCeanb 人 站 (4.1-7) 


其 中 fa (myF=0N- 寺 ， 亿 加 1=04… 本 -二 是 一 维基 底 向 量 所 组 成 的 正 交 集合 。 并 
以 全 = {e( 丰 mm 和 加 ={2 坟 中 扰 示 。， 则 让 人 4.1-3) 及 人 4.1-4) 式 可 知 它们 本 身 必 为 么 正 矩阵 ， 
亦 即 


4d47 = 4 人 = 了 及 一下 7 在 = (4,.1-8) 
通常 吾 和 4 相同 ， 所 以 人 1.0 和 (人 4.1-2) 式 分 别 变 成 


下 (上 站 = 习 了 at mmsma 人 个人 下 =447 (4.1.9) 


并 二 自 有 一 


= 宁 衬 FE De 心太 =4TF4 (4.1-10) 
对 于 一 NxAN 大 小 的 图 像 ， 其 变换 系数 (KE 六 使 用 (4.1-0 式 所 需 的 加 法 和 乘法 约 为 
ON ) ,这 样 的 计算 量 实在 太 大 - 对 可 分 离 变换 而 言 ， 由 (4.1-9) 式 中 虐 阵 相 乘 的 计算 复杂 度 
可 知 ， 其 计算 量 碱 少 为 CUN") 。 
晶 基底 图 像 Basis Image) 


令 丰 表示 矩阵 4 的 第 直行 . 并 定义 惩 阵 


有 二 本 人 (4.1-11) 
且 两 个 Wx 放 和 抵 阵 环 和 安 的 内 积 为 
(可 ,的 = 六 (mmg On (4.1-12) 


这 = 丫 由 一心 


则 让 (人 4.1-0 和 (4.1-2) 式 可 将 图 像 表示 成 级 数 
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= 呆 呆 Fe 门 4 (4.1-13) 
业 = 
FED= 《PP 太 (4.1-1 和 ) 


从 人 4.1-13) 式 可 知 尾 何 图 像 /都 是 六 个 矩阵 心 1=04 =-1 的 线性 组 合 ， 因此 公称 
为 基底 图 像 . 变换 系数 Pt 是 图 像 了 与 基底 图 像 Ai 的 内 积 ， 所 以 又 称 为 该 基底 图 像 的 极 
影 - 


以 下 将 介绍 几 种 较 常 被 采用 的 正 交 图 像 变换 ,包括 傅立叶 、 离 散 余弦 、 离散 正弦、 
Walsh-Hadamard ，Haar 、Slant、KL 、Hartly 、SVD 与 小 波 变换 。 


4.2 傅立叶 变换 
4.2-1 离散 傅立叶 变换 


离散 信和 叶 Fr 的 . - 维 离散 傅立叶 变换 (discrete Fourier transform, DFT) 如 下 所 示 


开 ( 卫 一 Z/m* ， k=01 -1 (4.2- 昌 
也 可 写成 
( 揣 = 2 站 机 六 (4.2-2) 


其 中 克 , = on 环 * 通常 被 称 为 变换 核 (kemeD) 。 而 F( 提 的 反 离 巩 傅 立时 变换 {IDFD 则 如 
下 所 示 : 


/四 = 呈 Fbet n = 0. N-1 (423 
堪 个 
因此 ， 形 成 下 面 的 变换 对 

有 人 王 (有 (4.2-4) 


一 维 离散 傅立叶 变换 有 以 下 的 性 质 : 
1. 线性 性 (Linearity) 


大 加 = 听 加 + 及 辐 扣 亚 有 向 = 人 + 巨人 (4.2.5) 


其 中 aa 得 为 常数 。 
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2 对称 性 (Symmetry) 
车 太 由 为 实数 ， 则 
(一 各 一 匹 "( 林 (4.2-6) 
3. 与 着 积 的 关系 
对 于 两 个 长 度 分 别 为 由 及 且 的 离散 信 生 An 与 .AD， 执 行 第 二 章 中 所 定义 的 卷 积 oOD 
= 下 ( 问 *# 六 (个 后， 有 阅 的 长 度 可 达 丰 = 四 + 久 --1。 现 在 将 让 人 与 让 分别 添补 如 -1 及 加 
-1 工 个 零 后 , 将 其 祝 为 长 度 为 六 的 两 个 新 序列 六 wx( 人 与 请 w(n, 且 其 闵 点 的 DFT 分别 为 局 内 
及 丽 昌 。 则 
BUDD=IDFTLER ID*+E2( 有 ] (4.2-7) 
换言之 ,这 是 通过 DFT 执行 卷 积 的 间接 方法 。 配 人 台 下 一 节 所 讨论 的 快速 情 立 叶 变换 ， 当 所 考 
嘎 信 和 的 长 度 大 到 一 个 程度 以 后 ， 以 人 4.2-7) 式 执行 卷 积 会 比 用 定义 直接 计算 快 ， 而且 信 和 号 长 


度 剑 长 所 节省 的 时 间 愈 多- 
二 维 离散 傅立叶 变换 具备 与 一 维 情况 完全 相同 的 性 质 。 


4.2-2 ”快速 傅立叶 变换 


快速 博 立 叶 变 换 (fast Fourier transfprm，FFT) 的 算法 ， 可 分 为 时 域 抽取 法 (decomposition- 
或 decimation-in-time，DIT) 和 频 域 抽取 法 (decomposition- 或 decimation-in-frequency DIEF) 
两 种 。 


名 DIT 的 算法 
艾 以 N= 16 的 离散 函数 Am 为 例 说 明之 。 因 为 = 16， 所 以 


下 ( 引 = 交 五 汪 ， 天 = 01 415 (4.2-8) 


依 偶数 位 置 和 奇数 位 置 ， 将 序列 .AD 分 成 两 个 序列 。 可 得 


下 1 
开 ( 拉 = 》 1ODRY + 》 FOOD (4.2-9) 
下 , 
因为 
-和 苦 , am 。 - 芋 .中 
卫 9 一 e 0 一 避 (4.2-10) 
所 以 


下 (大 ) = Cazir + HS Fa 上 十] 用“ (4.2-1) 
上 二 必 下 = 
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若 令 
(= 27 (4.2.12) 
有 (= 22+ 了 IJ (4.2-13) 
则 
忆 ( 有 = 之 刀 CDF 十 丽 62 (DY (4.2-14) 
令 
机 (站 = >》 记 ( 卫 六 (4.2-15) 
已 (站 = Y (PP (4.2-16) 


r=01 7 了 ， 即 分 别 为 ji 及 放 ( 人 的 8 点 DFT 重 写 (4.2-14) 式 ， 可 得 


RD= 机 (+RRO) (2-17) 
另外 ， 由 有 eeia = 两 "也 可 轻易 证 得 
Fr+ 史 = 机 (一 了 (4.2-19) 


r=01…7。 可 见 (4.2-17) 及 (4.2-18) 式 形成 一 个 运算 单元 ， 即 所 谓 的 冰 形 (butterfy) 运算 单 
元 。 在 图 42-1 中 , 用 图 形 来 代表 一 个 蝶 形 运算 单元 ,其 中 丽 5 这 一 项 通常 称 为 权重 (weighb) 
或 旋转 因子 (twiddle factom，(4.2-17) 及 (4.2-18) 式 代表 整个 FFT 的 最 后 一 级 ， 而 前 三 级 可 依 
此 类 推 。 亦 即 一 个 16 点 的 DFT 可 由 两 个 8 点 DFT 的 碟 形 组 合 而 成 : 各 8 点 的 DFT 可 由 两 
个 4 点 DFT 的 矶 形 组 合 而 成 ; 各 4 点 的 DFT 可 由 两 个 2 点 DFT 的 碟 形 组 合 而 成 ; 整个 DIT 
算法 的 流程 图 如 图 4.2-2 所 示 。 


Pa 站 1 下 站 下) 琴 Er) 
全 AN Zr TS 站 开 ( 十 器 
六 。 
(a) 录 形 运算 单元 节 ) 为 (a] 的 篇 图 


黑 4.2-{ FFT 的 DIT 运算 单元 
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Fe 页 卫 玉 
Pr=0 r=0 到 1 =f0 到 3 r=0 到 ? 














0000 | 0 > 0 0 | 0000 
1000 8 8 1 0001 
QI00 、 4 了 0010 
1100 | 12 12 3 0011 
0010 时 2 4 | 0100 
1010 ] 10 晶 10 5 101 
0110 > 6 人 | 0110 
li10 | 14 14 了 0111 
0001 1 | >C [ 8 1000 
1001 9 9 9 1001 
0101 5$ [> 5 ]0 1010 
1101 | 过 13 11 1011 
0011 3 帮 了 12 1100 
1911 | 1 1 13 1i01 
0111 了 > 了 14 1110 
1]111 15 15 ]5 1111 
第 一 级 





轩 4.2-2 整个 DIT 算法 的 流程 图 


图 中 输出 人 序列 的 序号 间 恰 有 位 倒 惫 的 关系 。 所 谓 位 倒 轩 就 是 将 一 序列 的 序号 的 二 进 制 
码 反 序 后 作为 新 的 序号 。 下 面 举例 说 明 。 


序号 0 1 2 3 攻 5 扣 了 

二 进 制 000 001 00 0 10 10 10 11 

反 序 000 100 00 10 0 101 0 11 

新 序 0 4 2 丰 1 5 3 7 
得 DIF 的 算法 


前 面 的 DIT 是 将 输入 序列 分 奇偶 位 置 打 散 , 但 在 DEF 的 算法 中 则 改 将 输出 序列 打 散 而 
其 他 过 程 则 相同 。 
我 们 再 度 以 六 = 16 的 离散 函数 . 产 m) 为 例 说 明之 - 因为 让 = 16， 所 以 


FOOD) -y/ (卫生 ， 天 =0 :415 全 .2-1 细 ) 
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将 上 式 依 /oo 拆 成 两 部 分 ， 即 
F- 立 7om + 
其 中 第 二 个 和 可 写成 
ram = 2 +8Fe 
= CD 十 8) 卫 他 
将 此 结果 代 回 必 .2-20) 式 可 得 


开间 = [AD+ 人 (DLA 人] 丽人 


由 此 得 
PFC->UO+7+t， 站 二 个 17 
FCk+rD=> LO-AorSPe ， 丰 三 站 1 …， 
利用 
聊 2 er 6 二 卫 
以 及 
We 人 
可 将 (4.2-23) 式 改 写 为 
产 (2 = > FOOD+TFT 耳 天王 0 
FE+D=ZUO- ora21 0， 
着 令 


ji DJ+Ar+ 四 上 且 放 =LAD 一 Fr+8F 


多 


7 


(4.2-20 


(4.2-2]) 


(4.2-22) 


(4.2-23) 


(4.2-24) 


(4.2-25) 


(4.2-26) 


(4.2-27) 
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FO 有 = 了 JAD ， 天 =04…7 
 ， (4.2-28) 
PF(CE+D= >》 ARw 天 =01…7 


亦 即 下 (2 昌 是 几 ( 门 的 8 点 DFT, FFHH+HT 则 是 站 (的 8 点 DFT。8 点 DFT 又 可 拆 成 2 个 4 
点 DFT， 仿 此 类 推 。 将 (4.2-27) 式 以 蝶 形 运算 单元 的 形式 呈现 如 图 4.2-3 所 示 的 结果 。 整 个 
DIF 算法 的 流程 图 则 如 图 4.2-4 所 示 。 





门 
成 站 区 天 站 有 yz af 
Ar+8) AL 
Ar+ 中 有 罗 
(a) 蝶 形 运算 单元 人 b) 为 (a] 的 简 图 
图 4.2-3 FFT 的 DIF 送 算 单元 
于 卫 1 丽 i 丽人 
pr= 交 到 了 Pr=0 到 3 r=0 到 T【 二 和 


站 
8 
个 
3 
了 
ff 
6 
二 
1 
9 
5 
3 
3 
1 
了 


nm ri 


一 一 一 一 一 一 
tm 证 





Ps 
(Am 
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贞 FFT 算法 的 流程 图 可 知 计算 复杂 度 : FFT 等 法 仅 需 (NA/2)log, 六 的 复数 乘积 ， 远 小 于 
DFT 的 六 ?个 复数 乘积 。 当 六 够 大 时 ， 执 行 效率 明显 提升 。 


4.3 ”离散 余弦 变换 


离 徽 余弦 变换 (discrete cosine transform, DCT) 是 离散 傅立叶 迹 换 的 一 员 ; 与 DFT 相向 的 
是 ,离散 余 弦 变 换 提供 了 有 关 信 号 在 频 天 的 信息 ， 与 DFT 不 同 的 是 ， 一 个 实数 信号 的 离散 余 
弦 变 换 具 有 实数 值 : 因 DCT 变换 为 线性 ， 故 可 表示 不 如 下 的 矩阵 网 量 形式 


下 = 弛 (4.3-1 


此 处 了 是 描述 信号 的 # 维 向 量 , 三 是 描述 变换 结果 的 六 维 向 量 ，C 是 描述 变换 的 Nx 和 非 奇 
措 实 数 算 阵 。 大 了 为 WxW 的 图 像 算 阵 . 则 其 DCT 的 抢 阵 形式 为 


玖 = CC (4.3-2) 
4.3-1 第 一 类 DCT 


设 .Jo 为 长 庆 六 的 离散 时 间 实 数 信号 ， 将 此 信号 连 向 其 对 称 复制 信号 定义 出 如 下 的 新 信 
号 (09 : 


22 rm ， mn-=0,N-1 
了 站 =4 onD ， 1 过 zs 去 N -2 (4.3-3) 
JUN -2， 丰 二 站 之 2 一 3 
太 ( 四 的 DFT 为 
帮 昌 = 六 AOL -227O0+257CX-DC 才 
+ 本 7COOHA + 人 JCN -nt 


=257(0+237(V -DLL 引 + 和 7 人 和 + 丽 吉 





=22 8700+22 7(w-DCL + 





部 -1 
=2》 atn) /om 叫 Tt } 0< 开 < 2N -3 (4.3-4) 
0 帮 ~] 


些 处 
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2 严 =00, 六 一 1 




















@( 联 一 其 他 情况 (4.3-5) 
序列 已 ( 旭 为 实数 且 满 足 五 ( 闪 = 焉 CN- 机 ， 所 以 
万 个 = 到 之 ( 间 栈 2 
-NI 六 人 J+5NL7I 5 (Y-DCIU 1 Z (1 ol 二 5 (4.3-6] 
根据 上 述 结果 ， 第 一 类 DCT 定义 如 下 
开 ( 了 = G 了 局 (了 = QQCOD DJ Cos 晤 (4.3- 疙 
TD [总 
从 (4.3-7) 式 可 得 Am = 0 (mm ， 连 同 (4.3-6) 式 可 得 反 变换 如 下 
JonD = 二 (DaODOFG 叫 ] (4.3-8) 
我 们 也 可 以 将 第 一 类 DCT 的 正 反 变换 用 和 抢 阵 向 量 运算 表示 
下 =Ci， 了 =CF (4.3-9) 
此 处 ， 
[c, 1 ， = 志 | CT ] 0 挟 jmsN -1 (43-10) 


Ci 称 为 DCT-I 和 矩阵 、 从 其 定义 中 可 清楚 看 出 这 个 矩阵 是 对 称 的 。 另 外 从 (4.3-9) 式 可 知 启 亦 
是 本 身 的 北 抵 阵 ， 也 就 是 


(C) =C (4.3-11) 
因此 DCT-I 矩阵 为 一 对 称 的 么 正 矩 阵 。 


4.3-2 第 二 类 DCT 


第 二 类 DCT 是 以 所 有 六 点 都 被 复制 的 .Ar9 信号 的 最 小 对 称 着 手 。 我 们 定义 


60 0 到 ms 雪 N-1 


= 4.3-1 
Jaw-1- 站 ss2w-1] 儿 31) 
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万 ( 阅 的 DFT 为 


了 村 一 1 


已 人 = 了 JCDH 人 ACN -1 站 有 芝 
肯 一 由 


用 一 站 


= 并 /公信 +Far 


如 = 必 


这 个 序列 不 为 实数 ， 对 无 值 亦 不 为 侦 对 称 ; 不 过 ， 如 果 再 乘 上 sw”， 也 就 是 


师 =1 
吕 昌 = 开 入 下 用 = 守 AO 扫 和 二 有 
H = 站 


页 一 ! 
- 卫 7mem| 下 光 站 | 0 大 下 二 2N -1 


是 二 个 


则 所 得 的 新 序列 书 ( 上 ) 有 如 下 性 质 : 
1. 序列 (各 满足 奇 对 称 关 系 式 


UCN- 有 = 一/( 昌 


也 就 是 
La 所 0.SNM2N 一 | _ -os| 玖 十 2 
和 六 
2. LVIN) =0， 也 就 是 
Cos 下 一 COS [ro 十 0. 引 |= 提 
原始 序列 可 用 CC6) 表示 成 
7 = 二 全民 优 ) 卫 二 = __ 人 D 昌 取 924 
2 | > 2 2 各 2 站 卫生 
-二 站 U(DYaertot SU 人 2 雄一 间 耳 站 
2 扣 人 2N 人 和 
一 -rr(0) 十 1 亲 U( 昌 全 os 十 卫 er05 站 ) 
37 2 所 2 卫生 
1 工 毛 和 (P 十 站 5 关 
= 有 LO) + 之 50eo 一 | 
变换 DCT-I 定义 为 


FUD= -00 的 


(4.3-13) 


(4.3-14) 


(4.3-15 


{4.3-] 划 


(4.3-17] 


(4.3-18) 


(4.3-19) 
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此 处 


8( 昌 = 22， 天 =0 
1， 上 尖 站 


将 (4.3-14) 与 (4.3-20) 式 代 人 (4.3-19) 式 可 得 
F( 日 = 此 > 5Dya 加 2 
将 (4.3-14) 式 及 (4.3-20) 式 代 人 (4.3-18) 式 斌 得 
7 了) = 民 Z&B5 () cd 23 
其 中 (4.3-21) 式 及 (4.3-22) 式 为 DCT-I 变换 对 ， 其 矩阵 向 量 表 示 式 为 
瓦 =CF， 了 =(Ca) 
[C]，， = 加 于 so 0< 科 天 nsW-1 


根据 人 4.3-23) 式 可 知 C 为 一 实数 规范 正 交 和 矩阵， 也 就 是 它 满足 
(cc 厂 二 (Ci 下 


此 处 


4.3-3 第 三 类 DCT 
第 三 类 DCT 为 第 二 类 DCT 的 递 矩 阵 或 转 置 抵 阵 ， 定 义 为 


FE( 昌 = 2 5D7n 叫 邓 二 3 亚 这 和 


Km= 此 Ze5 (大 co 25 二 " 
久 此 DCT-I 与 DCT-I 矩阵 有 如 下 关系 
和 二 (Cn 了 


4.3-4 第 四 类 DCT 
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(4.3-20) 


(4.3-211) 


(4.3-22 


(4.3-23) 


(4.3-24) 


(4.3-25) 


(4.3-26) 


(4.3-27) 


(4.3-28) 


PCT-L 与 DCT-II 在 上 与 = 都 不 为 对 称 ， 但 DCT-IV 与 DCT-I 一 样 都 为 对 称 ， 它 的 结构 
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式 与 DCT-Q 相似， 除了 将 /对称 展 开外 ， 我 们 将 它 调整 如 下 


AD， 0 关 m 过 太 -1 _ 
六 太 委 ps2N -1 (9 
DCTTV 定义 为 
于 (= 六 之 让 oz (4.3-30) 
其 反 变 换 式 为 
_ 12 起 T(r 二 03)( 估 十 0.5 _ 
= 必 包 (各 cd zt 人 0 | (4.3-33) 
(4.3-30) 式 及 (4.3-31) 式 的 推导 过 程 当 做 习题 。 其 矩阵 向 量 表示 式 为 
=Cuvr 和 =Cv (4.3-32) 
此 处 
[cv]，= 此 co oaeo3| 0< 下 asN_1 [4.3.33) 
从 人 4.3-32) 式 可 知 : Cr 为 一 对 称 的 规范 正 交 矩 阵 ， 亦 即 它 满足 
(Co = cn (4.3-34) 


4.4 离散 正 效 变换 


离散 正弦 变换 (diserete sine tiansform，DST) 与 DCT 相似 ， 它 被 视 为 傅立叶 正弦 级 数 
(Eourier sine series) 的 离散 时 间 版 本 ， 共 有 四 种 类 型 的 DST。PST 的 推演 过 程 与 DCT 的 推演 
过 程 类 似 ， 因此 我 们 只 定义 DST， 略 过 其 推导 的 骨 节 。 在 所 有 情况 下 ，0 到 吕 大 之 下 -1 


1，DST-I 
| 2 | FE+lze+Db 1 
[用 ]，， 二 XT1 串 二 | (9 ) = (4.4-1) 
2. DS9T-T 
轴 之 | 区 天 二 IT 人 二 人 .5] 1 
[Se = ，ea sa 20 | | G 大 = (4.4-2) 


3，DST-IE 
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| [mrEHL0.Sad+T 1 _ 
[Smh。 = je | 本 | (oo = 人 7 (4.4-3) 
4.DST-IV 
_ 12 .| rr+050z+03) 1 
[Srv je - 民 吉 四 1 | 作 v) = 故 iv 人 (4.4-41) 
在 上 述 定义 中 
c( 加 =42 ，n=Nr1 (4.4-5) 
0 严 闫 六 一 】 


4.3 Walsh-Hadamard 变 折 





Walsh 函数 是 一 组 定义 在 [0.1] 上 的 完备 正 交 和 矩形 函数 。 离 散 Walsh 函数 是 在 [0,1] 区 间 
上 对 连续 Walsh 函数 等 间 珊 取样 的 结果 . 在 图 像 处 理 中 ， 取 样 点 数 六 常 取 2 的 正 整 数 习 攻 ， 
此 时 Hadamard 变换 矩阵 与 Walsh 变换 矩阵 只 在 行 〈 或 列 ) 的 次 序 上 不 同 ， 因 坦 Walsh 变换 
与 Hadamard 变换 常 统称 为 “Walsh-Hadamard” 变 换 。 对 任意 的 正 整数 w，Walsh 变换 都 可 形 
成 ， 但 对 于 不 为 2 的 正 整数 习 老 的 闪 值 ，Hadamard 变换 不 一 定 可 形成 。 

此 处 只 考虑 W 为 2 的 正 整数 乘 圭 的 状况 ， 此 时 Hadamard 与 Walsh 的 变换 拖 阵 只 有 排列 
顺 座 不 同 。 为 了 至 更 此 种 善 别 ， 首 先 我 们 介绍 列 率 (sequeney) 的 观念 ， 再 分 别 探讨 Walsh 版 
以 及 Hadamard 版 的 walsh-Hadamard 变换 - 


4.5-] 列 率 


频率 可 定义 为 一 个 正 苞 冰 数 在 每 单位 时 间 内 所 经 历 的 周期 数 , 它 正 好 是 函数 值 越 罕 (zero 
crossing) 次 数 的 一 半 。 

频率 的 概念 可 以 推广 至 称 为 列 率 的 广义 频率 ， 列 率 可 定义 为 函数 在 单位 时 间 内 其 值 越 堆 
点 的 平均 次 数 的 一 半 。 列 率 可 用 来 措 述 在 一 个 区 间 内 有 不 等 间隔 的 越 零点 的 非 周 期 性 图 数 : 
对 于 周期 性 的 正弦 函数 ， 殉 率 与 频率 的 定 久 相当 。 

图 4.5-1 显示 在 一 个 区 间 f0 ,1) 上 的 一 个 连续 函数 (xz 。 由 于 该 区 间 上 函数 有 四 个 越 堆 
点 ， 所 以 列 率 等 于 2。 

0 


_L | lL LLLLLLe: 
0 1 


图 4.5-1 连续 函数 列 率 的 例子 
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对 于 离散 函数 fm ， 列 率 3 可 定义 为 


为 偶数 


(4.5-1) 
二 r 为 奇数 





其 中 ”为 在 单位 时 间 内 An 的 符号 变更 次 数 - 对 图 4.5-1 中 的 太 ( 轨 做 等 间隔 取样 . 得 到 一 个 
离散 画 数 注 (m ， 如 图 4.5-2 中 所 示 。 从 图 中 可 硬 出 其 符号 变更 次 数 为 >=4 ， 故 其 列 率 为 2。 


AN 
| | ， 


一 | | ll |l L | L 


人 T 


图 4.5-2 离散 施 数 列 率 的 例子 


4.5-2 Walsh 版 的 Walsh-Hadamard 变 接 


以 太 =8 为 例 ，Walsh 版 的 Walsh-Hadatmard 变换 ( 记 为 WwWHT) 的 变换 矩阵 互 ,为 


_ 变 号 次 数 
| 1 1 | 1 1 1 1 
1 1 1 -1 -1 -1 -1 

1 1 -! -1 -1 -1 1 1 

1 =-! -=-! 1 it -1 -=-! 45 
2.2|1 -1 -1! 1 1 -1 -1i 1 

1 -1 -! 1 -1! 1 1 -1 

1 -1 1 -1 -=-! 1 一 ! 1 

-1L- 1 -lj 


其 变换 系数 指标 上 、 变 号 次 数 上 及 列 率 3 的 关系 如 表 4.5-1 所 示 。 








届 台 mm 


囊 4.5-1 WwWHT 的 孙 的 列 率 








规 一 化 后 ， 可 轻易 验证 出 豆 , 为 一 对 称 的 正 交 和 矩阵， 因此 
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妞 ; = 万 ， (4.5-3) 
由 此 可 知 WWHT 的 正 反 变换 有 相同 的 变换 矩阵 。 其 一 维 正 反 变 换 核 Ai 六 为 


jl 有 -CD nr0 NM (4.5-4) 
pp 人 内 = 王 5(b8 四 (4.5-5) 
i0 


其 中 心 () 为 以 二 进 制 数 代表 整数 对 时 ,第 位 的 值 . ! 是 使 Y =2 的 值 。 另 外 , 若 凡 符号 四 表 
示 “XOR”(2 余数 加 法 ) 运算 ， 则 二 (的 的 定 疼 为 


丰 伏 ) = 六. (人 
8 二 六 TD) 田 已 3 估 ) 
刀 (向 = 咏 (后 四 蕊 3 后 (4.5-6) 


上 (的 十 (全 生态 估 ) 


以 Ci 胡 = (与 .6) 为 例 ，(4.5-4) 到 (4.5-6) 式 的 计算 结果 如 表 4.5-2 中 所 示 。 
囊 4.5-2 (4.5-4) 到 (4.5- 命 式 的 计算 实例 


站 区 区 1 克 | pam | am 
1 

4 | 瑟 

-1 

下 




















一 维 克 WHT 的 正 反 变换 为 
Wi-1 2 使 交合 
ED= 2 FOODREN= -天 六 二 1OCD (4.5-7) 
jn= 冯 FCDMka= 晤 POCO 到 (4.5.8) 
VN 各 
表示 成 矩阵 形式 分 别 可 得 
五 = 页 ,了 (4.5-9) 
六 = 瑟 x 正 [4.5-10) 


对 一 好 xx 图像， 其 二 维 WWHT 的 正 反 变换 核 为 


] 


MA 由 =- 人 CD (4.5-11) 
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PP 四 + PN= 3 到 ( 四 + 人] (4.5-12) 


上 于 大 六 大 杰 下 是 可 分 离 的 ， 即 


庆 庆 大 及 ,中 二 看 ( 四) 用 (站 (4.5-13) 
故 二 维 WwWHT 变换 的 矩阵 形式 为 
工 = 五 (4.5-14) 
三 = 吾 ，FB， (4.5-19) 
相对 应 的 变换 式 为 
] sea ore] 
FE 人 月 = 一 -一 ,PC 二 4.5-16 
(天 月 可 记 生 ] PC (4.5-16) 
1 则 一 ] 六 一 | 号 1 池内 JHE 人 站 人 人 
,四 二 一- 一 一 开 ( 记 站 (-]) (4.5-17) 
Jom 丫 记名 (PCD 


4.5-3 Hadamard 版 的 Walsh-Hadamard 变换 


以 六 =4 秋 =8 为 例 ，Hadamard 版 的 Walsh-Hadqamard 变换 ( 记 为 HEWHT 的 两 个 变换 
定 阵 为 


变 号 次 数 
1 1 1 1 0 
1|1 -1 1 -1! 3 
再 = 二 4.5.1 台 
” 211 1 -1 -1 1 全) 
1 -1 -1! 1 2 
变 号 伺 数 
1 1 1 1 1 1 1 1 0 
1 -1! 1 -1 1 一 1 1 -1 7 
1 1 -1 -1! 1 1 -1 -1 3 
1 -1 =-1! 1 1 -1 -1! 1 
五 =-_ (4.5-19) 
2./2 |1 1 1 1 -1 -1 -1 -! 1 
1 -1 1 -1 -1 1 -1 1 6 
1 1 -1 -1 -1 -1! 1 ! 2 
1 -ii -1 1 -1! 1 1 -1] 5 





其 中 豆 , 的 变换 系数 指标 上 ， 变 号 次 数 及 列 率 的 关系 如 表 4.5-3 所 未 、 
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上 诺 表 4.5-3 可 知 ， 其 列 率 的 顺序 并 不 像 WwWwHT 一 样 是 递增 的 ,但 是 这 样 的 好 处 是 其 变换 
德 阵 可 由 适 代 关系 得 到 , 它 是 由 +1 和 -1 的 元 素 构成 的 =2 阶 方 阵 : 在 = 天 时 ， 形 成 
该 给 阵 的 过 代 关 系 为 


1 41 
百 . = 一 十 .SS-20 
.2 ， - | 
五 到 ,- 
= 二 | 全 ”| = 已 ; @ 鼠 - (4.5-21) 
万 | 百 ， - 吾 - 


读者 可 以 此 式 验证 (4.5.18) 及 (4.5-19) 两 式 中 的 吾 , 与 下 - 
经 过 规 化 后 ,矩阵 吾 , 有 下 列 性 质 ， 
1， 互 ,是 一 对 称 挎 阵 ， 即 


互 , = 殖 ， {4.5-22) 
2， 五 , 是 一 正 交 矩阵 ， 即 
瓦 ,= 硬 , 吾 : = 了 (4.5-23) 


由 上 两 式 可 得 瓦 y = 五 , ， 这 说 明 HWHT 的 正 变换 矩阵 与 反 变 换 矩 阵 完 全 相同 ， 即 它们 的 正 
反 变 换 核 相同 ， 因 此 其 正 、 反 变换 的 求 和 表示 式 也 一 致 . 


一 维 HWHT 的 变换 核 疙 ,请 为 
天 (天 ,划一 方 CD 天 =0 ,1 [4.5-24) 
PP 名 = 了 六 (5 (4.5-23) 


其 中 心 伏 ) 为 以 二 进 制 数 代 表 整 数 开 时 ， 第 ;位 的 值 . 网 表 45-4。 
表 45-4 二 进 制 编码 
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在 上 述 定 义 之 下 ，-- 维 HWHT 的 正 、 反 变换 的 求 和 式 分 别 为 


加 = 末 JOAN - 专 呈 /oO (4.5.26) 
宁 PUDUED=_- 二 时 Pb D 闻 we (4.5-27) 
7 加 = 之 ] 忆 加 -7 迄 - 
以 矩阵 形式 写 出 的 HWHT 正 、 反 变换 式 是 
已 = 克 , (4.5-28) 
也 = 吾 , 正 (4.5-29) 
对 一 好 x 六 的 图 像 ， 其 二 维 HWHT 的 正 、 反 变换 核 为 
| 下， 一 一 二 下 了 和 计 忆 作 中 _ 
En ATC (4.5-30) 
POPm+P(ED= 王 蕊 CCm+RCD2 CD] (4.5.31) 
1 


显然 这 个 变换 核 是 可 分 离 的 ， 即 
所 六 大 下 三 站 (站 站 ) 和 (天 问 {4.5-32) 
二 维 HWHT 正 、 反 变换 示 示 式 为 


0- AT 之 生 Jp CD (45.33) 
1] Ai 如 naomaetbaol 
7 有 = 之 包 FDCD 、 (4.5-34) 
0 Kb 
由 于 变换 核 可 分 离 、 又 由 于 玖 ,的 对 称 性 ， 二 维 变换 的 矩阵 形式 是 
到 -= 囊 百 ， (4.5-35) 
了 汪 = 万 |, 厂 五， (.5-36) 


可 见 正 反 变 换 不 仅 相同 ， 而 且 有 十分 简单 的 形式 。 


4.$-4 快速 Walsh-Hadamard 变换 
Walsh-Hadamard 变换 也 可 以 用 快速 算法 来 实现 。 其 中 一 种 算法 的 基础 与 快速 傅立叶 变换 
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的 妊 形 运算 雷同 。 出 于 Walsh-Hadamard 的 变换 核 是 可 分 离 的 , 二 维 的 变换 可 以 由 二 次 一 维 变 


摘 来 实现 ， 所 以 下 面 只 讨论 一 维 的 快速 算法 。 
和 快速 罗 WHT 变换 。 
下 面 以 4 点 的 变换 来 说 明快 速算 法 。 此 时 克 =4., 故 由 人 4.5-7) 式 可 得 


上 
了 1 做 地 fm 


FUD= 了 交 7ODC0 
FO-5LO+AO+ACOO+7G 


天公 = 二 LO+7O-A) -7G 


下 ( 力 = LA -了 + 扩 轨 一 了 3 


FG=5UO-7O-ACO+7G 


车 定义 


瓦 = 0 + Gil 瓦 = 5 +G]] 


己 = ( 仙 一 . 帮 2 让 五 = 5[/ 修 -/ 3 
则 (4.5-38) 式 可 改写 成 

F(g)= 瓦 + 局 ， 下 人 昌 = 瑟 上 + 瓦 

天 2= 已 -已 ，FG)= 书 一 六 


(4.5-37 


(4.5-38a) 


(4.5-38D) 


[4.5-38c) 


(4.5-38d 


(4.5-398) 


(4.5-39b) 


(4.5-40a) 


(4.5-40b) 


因此 整个 计算 过 程 由 图 4.5-3 所 示 的 信号 流程 图 来 表示 。 由 图 中 可 看 出 与 快速 傅立叶 变换 一 
样 ， 具 有 录 形 运算 的 基本 结 梅 。 


1 Il2 而 1 FLO) 


AO) 


图 4.5-3 4 点 快速 WWHT 变换 信号 流程 图 
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@ 快速 HWHT 变换 

因为 HWHT 变换 与 WwWHT 变换 的 不 同 仅 在 变换 气 阵 中 元 素 的 顺序 不 同 , 因此 这 种 快速 
算法 只 需 对 上 一 小 节 讨 论 的 快速 算法 稍 加 修改 就 可 得 到 。 最 简单 的 方法 就 是 将 贺 4.5-3 输出 
端的 结果 拉 出 ， 改 变 成 HWHIT 所 需 的 顺序 即 可 





4.6 Haar 变换 


Haai 变换 是 以 Haat 阴 数 为 其 基底 的 对 称 可 分 离 么 正 变 接 。 它 的 大 小 限制 为 六 =2 ， 其 
中 了 为 正 整数 傅立叶 变换 的 基底 盖 数 仅 在 频率 域 上 不 同 ， 而 Haar 变换 却 在 位 置 (positiom) 
及 尺度 (scale) 上 产生 不 园 ， 此 点 由 其 基底 阴 数 (例如 4.6-4 式 ) 可 明显 看 出 . 这样 的 特征 使 
Haar 变换 与 先前 介绍 过 的 其 他 变换 法 有 所 区 别 . 事实 上 上 ，Haar 变换 被 视 为 4.11 市 要 介绍 的 
小 波 变换 (wavelet transform) 的 简单 例子 - 

因为 Haar 函数 在 尺度 及 位 置 上 产生 变化 , 所 以 必须 用 一 对 偶 指 标 技术 来 表示 . 令 整 数 大 
0 到 大 入 六 一 1 ， 以 另 两 个 整数 p 与 9 来 表示 


下 =22 + 一 1 (4.6-1) 


值得 往 意 的 是 : 不 仅 丰 为 器 与 9 的 表 数 . 疡 与 9 亦 为 大 的 函数 : 对 任意 大 >0，27 为 27 反 大 的 
2 的 最 大 乘 奖 ， 而 9 - 证 为 余数 . 例如 N=4 时 与 9 的 值 如 下 : 




















在 f9.J] 区 间 中 ，Haar 冰 数 定义 为 
1 








jn0= -大 (4.6-2) 
1 
， _ 工 
21? ， 2 < xc 2 
2 2 
] 
叫 如 一 二 
1 二 
= -| -2 元 <x< (4.6-3) 
0， 其 他 情况 


若 令 x= 忆 友 ， 0 ,有 -1， 则 可 造 出 一 组 基底 函数 。 例 如 8xg 的 Haar 公正 变换 核 的 
矩阵 姑 (4.6-4) 式 所 示 。 


1 1 1 1 1 1 
1 1 1 1 -1 -1 =- 

如 2 0 0 0 

有 LO 0 0 0 本 一 放 
8 8 2 一 2 0 人 0 0 0 
0 0 2 -2 0 0 0 

0 0 0 0 2 -2 0 

0 0 0 0 0 0 :>: 
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.6-4) 


由 于 第 阵 中 存在 许多 常数 与 零 值 ,所 以 Haar 变换 的 运算 非常 快速 - 由 变换 抢 阵 的 列 中 可 
看 出 . 处 理 输 人 数据 的 解析 度 可 由 粗 到 细 , 每 次 以 2 的 乘 笑 变 化 。 在 图 像 处 理 的 应 用 中 . Haar 
变换 适合 用 来 找 边 缘 之 类 的 特征 ， 这 是 因为 其 变换 基底 函数 中 就 存在 粗 绍 不 同 的 特征 .对 输 


人 数据 作 变 换 ， 相 当 于 找 出 其 与 基底 函数 各 的 相似 性 . 
4.7 和 斜 变换 


对 于 六 x 克 的 插 变换 (Stant transformy 我 们 定义 为 


1 0 ! 0 
GAN bw | 一 GAN 画 ， 
1 8 mn 如 va 8 
页 一 站 全 本 本 是 昌国 昌 昌 昌 要 | 本 RE CT 下 CDOT 
” .0 1 | 0 -! 1 
一 如 &x 1 x 8 《 
如 有 Joy > 丰 [一 了 -2 


其 中 忆 ; 表示 一 个 妈 x 邮 的 单位 华 阵 而 且 


1 |1 1 
s- 病 
另外 ,参数 av 和 加 的 定义 为 


[ 3N? ] [ N2-4 ] 
8 一 2 ， bw = : 
4(N: -]) 4(Nz -1 


使 用 (4.7-1 式 和 (4.7-3) 式 的 方法 ， 可 将 一 个 4x4 的 斜 变换 插 阵 写成 








1 0 1 0 1 1 0 0 
1 有 1]1 -1 90 人 _ 
0 1 0 -万 bool 中“ 
-5 0 0 1 -1 


(4.7-2) 


(4.7-31 
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1 1 1 1 

3 1 2 2 二 3 
8 Li 有 (4.7-5) 

21 -1 -1 -l 

1 23 3 世 

1 有 本 

名 斜 变换 的 性 质 
1. 斜 变换 必须 是 实数 目 正 变 ， 因 此 

S=8，8S1=Sr (4.7- 


2. 斜 变换 是 一 种 快速 变换 ， 其 对 一 个 六 维 向 量 的 计算 最为 OUVlog, W) 的 等 级 。 
3. 它 具 有 好 的 能 量 集 中 特性 。 


4.8 KKL 变换 


由 Karhunen 和 Loeve 两 人 所 共同 提出 的 攻 L 变换 ， 原 先是 作为 对 连续 随机 过 程 的 级 数 
展开 之 用 。 而 对 于 随机 序列 ，Hotelling 最 先 探讨 主 值 成 分 法 (the method of principal 
components)， 其 实 它 是 KL 级 数 展开 的 等 效 离散 版 本 。 因 而 有 时 KL 变换 也 称 为 Hotelling 变 
换 ， 或 是 主 值 成 分 法 。 

考虑 一 维 么 正 抵 阵 惠 ， 如 下 所 示 


了 = 路 "大 ， 天 = 古 ? 了 (4.8-j 


此 处 其 =[zoxzxz exrn 和 王 =[D 广 械 分 别 为 在 空间 域 及 变换 域 中 的 数 
据 。 空 间 域 由 的 数据 为 实数 ， 变 换 域 中 的 数据 为 复数 。 令 规范 正 交 序列 少 (如 为 变换 
矩阵 田 = 全 ( 台 的 行 。 同 时 令 忠 为 一 表示 基底 序列 { 他 (各 } 的 列 向 量 . 也 就 是 
[网 (08 有-D7 ， 则 发 可 以 被 写成 这 些 基底 向 量 的 权重 和 ， 亦 即 


由 (0) 而 《0) 上 和 (0 JJ0 
慷 一 名人) 办 遇 本 如- 全 了 他 .8-2) 
页 -7 
J 


和 N- 


第 中 章 ”变换 法 -79- 





令 改 的 哉 取 表 示 式 (truncated representation] 为 于/ 


了 ~] 
大 = 》 儿 儿 . (4.8-3) 


(4.8-3) 式 中 的 截取 表示 式 所 导致 的 均 方 值 误 差 为 
e= 研 (全 ~ 于) ( 交 一 下] 





= 三 [2 ] [2 ] = 二 z 人 7] (4.8-4) 
此 处 设 无 为 实数 随机 变量 日 其 平均 值 为 受 。 因 为 = 一 ?其 ， 所 以 
ce= 呈 orOTDO -了 orRag， (8.5) 
此 处 严 。 为 向 量 天 的 协 方差 矩阵 。 


为 得 到 最 佳 变 换 ， 我 们 要 找 出 符合 规范 正 辫 性 限制 (orthonormality constraint) 
作 I 币 = 人 ，， 并 可 和 将 z 最 小 化 的 基底 函数 更 。 
用 拉 格 妆 日 乘 数 法 ， 将 下 式 节 小 化 


了 = 末 [ 必 7 玉 和 一 1 (省 砚 . 一] (4.8-6) 
将 上 式 有 关 旬 .的 每 一 项 取 梯 度 并 令 其 为 零 向 量 可 得 

2 素 第 -21 下 = 一 及 人 必 = 不 入 (4.8-7] 
也 就 是 说 

玉生 7 = 必 4 (4.8-8) 


此 处 4=diag(4 0 4)， 即 主 对 角 元 素 为 和 ,和 ,4 的 对 角 和 矩阵 。 因 此 腥 为 一 协 方差 
矩阵 尼 。 的 特征 向 量 ，4 为 特征 多 项 式 14. 了 一 民 er| 的 一 个 根 。 由 于 玉 w 为 一 实数 对 称 矩 阵 ， 
所 有 1 4, } 为 相 异 的 非 负 值 实数 ， 所 以 最 小 的 2 为 

es = 人 6r0G)- 末 1 (4.8.9) 


如 此 ，< 由 将 丸 降 阶 排列 来 达成 最 小 化 。 基 底 向 量 集 合 将 会 把 协 方差 矩阵 忍 rr 对 角 化 ， 这 可 
由 下 式 看 出 





R = 焉 ,GT=dOr4=14 (4.8-10) 
总 之 ， 钙 为 KLT 的 公正 矩阵 ， 它 可 产生 一 对 角 抢 阵 束 ,- ， 因 而 可 以 将 变换 后 的 系数 阁 的 
相关 性 完全 去 除 。 此 外 ， 它 可 将 总 信和 号 能 量 重 新 配置 给 前 工 个 系数 。 
比较 (4.8-4) 与 (4.8-9) 式 ， 我 们 得 到 
4 =] (4.8-1 
既然 < 是 由 特征 值 4 的 降 阶 排列 来 达成 最 小 化 ，e 也 可 由 将 系数 的 振幅 降 阶 排列 来 达成 最 
小 化 。 值得 注意 的 是 ， 虽 然 许 多 矩阵 都 可 以 去 除 输 人 信号 的 相关 性 , 但 KLT 不 只 可 以 完美 地 
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去 除 输 人 信号 的 相关 性 ， 同 时 可 以 达成 信 叶 能 量 重 新 配置 的 最 传 化。 不 过 ， 显 然 基底 困 数 与 
协 方差 矩阵 及 se 有 关 ， 因 此 不 能 事先 决定 - 此 外 ， 给 一 协 方差 矩阵 ， 找 出 KLT 的 基底 函数 通 
常 需要 大 量 的 计算 . 基于 上 述 理由 ，KLTI 实际 上 很 少 用 . 反倒 是 像 DCT 等 与 信号 数据 无 关 
的 次 佳 变换 常 被 使 用 : 





4.9 险 特 莱 变 换 


Bracewall 于 1983 年 提出 一 个 离散 实数 值 么 下 变换 以 取代 傅立叶 变换 。 称 作 哈 特 菜 变 换 
f{Hartley transform) 是 因为 此 变换 是 从 1942 年 哈 特 菜 所 提出 的 连续 积分 版 本 中 推导 出 ”了 哈 特 
革 变 损 是 利用 以 下 的 正 交 责 数 easf6) 当 基 底 昌 数 而 做 正 交 变换 





cas(B= SinfB) +eosfD) (4.8-11) 
二 维 离散 哈 特 药 变 换 对 定义 为 

严 ( 昌 = 二 六 了 ro 四 叫 笃 (+ o| (4.923 

了 (mL = 二 之 呈 0 台 至 om| (4.9-3) 


险 特 莱 变 换 与 DFT 有 类 似 的 性 质 ， 对 某 种 应 用 而 言 ， 哈 菜 特 变换 比 DFT 在 计算 上 有 效率 ， 
但 有 些 时 候 却 比较 费时 - 


4.10  SVD 杰 换 


-一 个 双 x 下 算 阵 4 训 表示 成 
则 = 74 了 (4.10-1) 


其 中 己 与 亚 的 规范 正 交 行 向 量 分 别 为 44 与 4 4 的 特征 问 量 ，4 为 一 对 前 元 素 是 4 的 特征 
值 的 交 x 交 对 角 惩 和 阵 。， 些 特征 值 又 称奇 异 值 (singular value): 因 严 与 严 为 么 正 此 阵 ， 故 可 推 
得 





4=ET4P (4.10-2) 


王 式 为 正 变换 ， 人 4.10-9 式 为 反 变 摘 ， 二 者 为 变换 对 .此 变 搞 称 为 厅 异 值 分 解 (singular value 
decompositior, SVD) 变 摘 。 如果 入 为 对 称 . 则 书 就 等 于 了 此外， 亚视 变换 图 像 4 而 定 . 一 
般 来 说 在 变换 过 程 中 必需 计算 每 … 图 像 的 44 与 44 的 特征 向 是 . 另外 值得 注意 的 是 : 因 
为 4 为 -- 对 攻 和 上皇 阵 ， 它 至 多 有 克 个 非 零 元 素 . 田 此 可 得 至 少 闵 倍 的 无 失真 压缩 通常 ,部 分 
奇异 值 都 小 到 可 以 忽略 ， 因 此 失真 压 旨 可 借助 忽略 较 小 奇异 值 来 达成 ， 此 时 均 方 误差 就 是 所 
忽 路 的 奇 借 值 的 总 和 。 
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SYVD 变换 看 似 不 可 思议 的 压缩 动能 可 能 会 产生 遂 解 , 虽然 全 幅 图 像 可 以 压缩 成 妈 的 对 角 


元 素 . 但 图 像 的 核心 矩阵 书 和 下 必须 由 原 图 像 计 算 取 
送 达 。 
在 此 举 一 实 例 说 明 SVD。 考 起 矩阵 4 如 下 














得 ， 而 且 它 们 必须 在 接收 端 重建 图 像 前 





1 2 1 
A=|2 3 2 (4.10.3) 
1 2 1 
因为 4 为 对 称 拖 阵 ， 故 可 知 马 = .因此 
6 10 6 
44I=4I4=|10 17 10 {4.10-4) 
6 10 6 
其 特征 值 为 
| 28.86 
4 | =| 0.14 仁 .10-5) 
0， f 
特征 向 量 则 为 
0.454 0.542 -9.707 
本 = 隐 =|10766|， 了 歼 ; = 隐 =|-0.643 于, = 了 = 人 4.10-6) 
0.454 0.542 一 0.707 
奇异 值 在 下 列 定 阵 的 主 对 闻 线 上 
S.37 0 0 
4=ETI4=| 0 -0372 10 {4.10- 力 
0 f f 
SVD 的 展开 式 可 写成 
4-y4 析 Pr (4.10-8) 
注意 到 第 二 个 奇异 值 远 小 于 第 一 个 ， 因 此 可 勿 略 (4.10-8) 式 中 的 4，， 而 得 旭 的 近似值 区 
下 
111 187 1431 
4= 4E7 光 =.87 3.15 1.87 (4.10-9) 
1.I1 1.87 1.11 
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4.11 小波 变 换 


近年 来 有 一 个 新 变换 常用 在 图 像 压缩 、 边 缘 与 特征 检测 以 及 纹理 {texnre) 分 析 等 问题 
上 ， 这 个 变换 就 是 小 破 变 摘 (wavelet transfermm, WT)。 与 情 立 叶 系 列 的 变换 所 采用 的 纺 式 波 基 
底 相 比较 而 言 ， 小 锌 变换 的 基底 有 较 短 的 衬 续 时 间 (time duratiom)， 因 而 得 和 名。 图 4.11-1 显示 
二 个 频率 不 同 的 余 芝 波 形 及 二 个 位 置 与 频率 皆 不 同 的 典型 小 波 图 形 。 











畦 4.14-f 芝 式 波 与 小 波 


一 个 关 态 (transient) 信和 号 的 分 量 通常 只 在 很 短 的 时 间 区 间 内 不 为 零 , 同 理 许多 图 像 的 重 
要 特征 (如 边缘 等 ) 也 只 出 现在 局 部 的 小 空间 工 . 这 些 分 量 与 任何 傅立叶 系列 的 基底 琢 数 都 
不 像 ， 因 此 表达 这 些 信 和 号 分 量 时 显得 非常 没有 效 诸 。 小 流 的 出 现 正 是 针对 这 个 缺点 和 而 来 - 


4.11-1 时 频 分 解 
假想 有 一 个 较 平 滑 (频率 较 低 ) 的 信 生 加 上 在 某 个 时 间 所 产生 短 而 快速 的 暂 态 信号, 称 此 
合成 信和 叶 为 AD 。 以 传统 傅立叶 分 析 
PFC)= 上 ADen2ed (4.11-1) 


我 们 从 频 域 上 可 知 有 暂 态 信号 出 现 ， 但 却 不 知 在 何 时 出 现 。 如 果 在 取 情 立时 变换 前 先 荡 上 -- 
全 时 窗 ， 则 至 少 可 知 斩 态 发 生 在 哪 一 个 时 窗 范围 内 。 设 此 时 窗 函 数 为 S 朱 ， 则 此 时 窗 范 数 的 
傅立叶 变换 ， 或 称 短 时 傅立叶 变换 {fsherttime Fourier transform, STFT)， 可 写成 


F(Q2DD= 70g -Ted (4.11-2) 


当时 窗 gb 为 高 斯 函数 时 ，STFT 就 称 为 Gabor 变换 。STFT 有 装 定 持续 时 间 的 时 窗 gfnD， 以 
及 一 个 转 定 的 频率 解析 度 。 这 是 测 不 准 原理 (unceltainty htinciple) 的 自然 结果 。 该 原理 是 说 ， 
对 任何 变换 对 g(] ce CGI ， 
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OrGe > 人 .1-3) 
其 中 只 有 当 gfD 为 高 斯 曙 数 时 等 号 才 成 立 , 而 Cr 与 ao 分 别 为 度量 8(D 及 G(2) 的 均 方 根 散 开 
程度 

， | egOld 本 12316 人 2 dd 

”eof jlecol ac 
图 4.11-2 显示 STFT 在 时 频 域 平面 上 的 解析 度 。 


(4.11-4) 





国 4.11-2 STFT 在 时 频 域 平面 上 的 解析 度 


小 波 变 换 的 基底 是 由 一 个 原型 (prototype) 函 数 的 缩 张 (dilatiom) 与 平移 ftranslatiom 所 形 
成 的 。 这 些 基 底 本 数 具有 短 持 续 时 间 且 高 频率 ， 以 及 长 持续 时 间 且 低频 率 的 特性 ,因此 相当 
适合 表达 高 频 的 突 发 暂 态 信和 号 或 是 长 时 间 缓 慢 变 化 的 信和 号 。 其 时 频 域 上 的 解析 度 如 图 4.11-3 
所 示 。 比 较 图 4.11.2 与 411-3 可 看 出 ， 小 波 变 换 提 供 一 个 很 有 弹性 的 时 频 解析 度 。 





图 4,1t-3 小 波 变换 在 时 频 域 平 醒 上 的 解析 度 
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4.11-2 连续 小 波 变换 


与 短 时 傅立叶 变换 相似 的 是 : 小 波 变换 将 一 个 时 全 果 数 山 射 至 一 个 ax 和 T 的 二 维 孙 数 。 
此 处 参数 a 称 为 尺度 fscale) 参数 ， 作 用 是 将 函数 做 压缩 或 伸展 : 而 了 为 沿 闭 时间 轴 的 小 疲 画 
数 的 移动 。 设 信号 7D) 为 平方 可 积 (square integrabljej， 表 示 为 AnE 天 全)、 也 就 是 


| 产 Ddt<= (4.11.5) 
则 ro 的 连续 小 波 变 换 (continuous WwWTCWT) 为 


CWT(a,T) = 一 | 15 (4.11-6) 
所 经 


此 处 wyr0) 为 基本 {basic) 或 母 小 波 (mother waveleb 且 wftt 一 嫩 /o7va 为 小 波 基底 函数 有 时 也 
称 子 小 波 (baby waveleflj，。 若 满足 下 列 许可 条 件 fadmissibility condition) 


到 (0) = 上 we 考 (4.11.7) 


则 小 流 变 换 为 可 送 的 (invertible)- 
基本 小 波 可 以 为 实数 尸 复数 ， 这 也 会 导致 变换 的 结果 对 应 为 实数 或 复数 。 当 多 人 为 复数 
时 ，( 人 4.11-6) 及 (457) 式 中 将 政 采 用 其 共 轮 复数 .在 某 些 应 用 中 ， 由 于 小 波 变换 的 相 角 含有 许 
多 有 用 的 信息 ， 所 以 使 用 复数 小 波 会 较 有 益处 .以 下 是 一 些 g( 扩 及 其 傅立叶 变换 的 例子 ， 
(1 Merie 
Y(D= ione 玉 
(OoOj= V2re (4.11-8) 
(2) 高 斯 二 次 导数 


(= 人 -PP)e 
到 (=wV2raoze 开 (4.11-9) 


(3 Haar 


0， ”其 化 情况 
Kg)= 产 -到 (11-10) 


(4) Shannon 
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weD= sinlrt/2) | 3 ] 


了 7 2 
用。 和 <| 吉 < 和 _ 
vawc 必 其 他 情况 (4.11-11) 


图 4.11.4 显示 上 述 小 波及 其 博 立 叶 变 换 。 图 4.11-5 则 为 小 波 Haar 及 其 子 小 波 。 从 贸 
4.11-4 及 4.11-5 我 们 可 以 推论 出 下 列 小 波 的 特性 : 
1. 当 四 =0 时 多 (@)=0 ， 也 就 是 | wo dt= 0 ， 换 名 话说: 它们 具备 符 DC 值 。 


2. 它们 和 缘 为 带 通信 和 号。 
3. 它们 随时 间 违 速 朝 零 衰减 。 


HH 和 
0 的 


mm 


{a] Merlet 
人 平 (的 
收 
呈 0 捷 0 -9 折 
作 ) 高 斯 二 次 导数 
范 人 
| 到 (| 
改 
WTANM 
用 45 1 0 0 
(e] 再 aa 


图 4.11-4 ”一 些小 波及 其 傅立叶 变 接 ( 待 续 ) 
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yw 人 了 
册 
站 日 
是 
(dy Shannon 
画 4.11-4 ( 续 ) 
1 了 
可 (的 旋 叶 人 
1 1 
0 1 上 厂 。 4 下 
1 2 
-1 万 
革 工 _1 2 
了 风 本 2wf2r 一] 
工 2 
2 8 ! ， 
0 才 ! 06.5 
| ~ 只 


力 4.11-5 Haar 小 波 与 其 于 小 波 


4.11-3 离散 小 波 变换 
在 (4.11.6) 式 中 ，(c, 如 皆 为 连续 变量 且 在 flt) 的 CWT 描述 中 具有 宛 依 性 (redundancy)-。 
因此 没有 必要 针对 所 有 可 能 的 {a, 如 值 去 计算 CWT(e, 人 中。 此外, 针对 有 限 (e, 呆 值 的 计算 就 有 


实际 上 的 必要 。 
当 (@a 为 离散 值 时 ， 若 令 a =ay ,=Pmzroar ， 其 中 六 与 半 为 整数 ， 则 此 时 离散 小 波 变换 


为 
DWTGs 站 = 人 DOw(Ddt (4.11-12) 


此 处 
Us 人 = ao2g(ait 一 nro) Wo 人 =Y 人 GD (4.1-13) 


对 于 一 个 规范 正 交 的 小 波 {ww(D } 而 言 ， 它 必须 满足 


第 四 章 ”变换 法 -87- 


1， 瑚 = 了 玉 天 二 于 


[wovwodn 必 其 他 情况 (411-19) 


这 表示 在 同一 个 尺度 六 或 跨 尺 度 下 ， 它 都 是 规范 正 交 的 。 

在 许多 工程 度 用 上 . 常 采用 四 =2,2 =1， 亦 即 用 2 次 寺 格 点 (dyadic grid) 取样 。 针 对 
下 状 况 ,， 接 下 来 我 们 将 以 多 重 解析 度 (multiresolutiom 的 观点 将 小 波 变换 与 子 带 滤波 (subband 
filter bank) 相连 结 ， 进 而 可 以 用 滤波 器 来 展现 小 波 变换 。 

当 函 数 了 属于 一 个 空间 已 {R ， 刚 有 一 尺度 fscaling) 图 数 从 昌 使 得 了 从 天 (空间 滤 得 较 
为 平 消 的 子 信 号 。 所 谓 只 度 画 数 可 视 为 低 和 通 汪 波 器 ， 而 同一 层 的 高 通 泪 波 器 即 为 小 波 画 数 
w(t) 。 前 述 的 平滑 子 信 号 再 由 经 缩 张 和 位 移 后 的 尺度 函数 进一步 析出 细节 部 分 而 逐渐 平滑 
化 , 依 序 进行 使 原始 信和 肝 被 映射 到 一 连 昌 的 子 空间 。 设 此 一 连 串 的 子 空间 内 凡 ,meZ (整数 ) 
表示 且 此 子 空间 满足 下 列 性 质 : 

1. 包含 性 : … 太 世态 王 也 区 帮 区 太 ，… 

+ 二 粗 (解析 度 低 ) 细 (解析 度 高 六 ， 
2. 完备 性 : 门 记 = 好 , 同 太 = 天 (有 
JE 守 HE 了 

3. 尺度 性 已 凡人 了 用 E 必 

4. 基底 性 质 对 于 一 个 尺度 函数 内 中 e 屿 使 得 办 (人 =2 82f- 术 所 构成 的 集合 是 及 
的 一 个 规范 正 交 基底 ， 也 就 是 人 ge (DOgv (D=6,v 。 

设 有 ,空间 经 由 多 NO 证 除 的 信 生 存在 另 一 正 交 基底 组 成 的 子 空 间 刺 , 中 使 得 
六 = 及 国 歼 ,及 上 卫 , 。 如 同 尺度 函数 入 及 可 展 臣 (spam) 出 信号 空间， 另 一 函数 w(O 则 
展 延 出 丈 信 生 空间 ， 而 wb 就 是 先前 提 过 的 小 波 函数 。 接 着 我 们 以 同 量 投影 的 观念 讨论 信和 叶 
空间 的 分 解 . 设 投 影 运 算 子 己 及 台 , 将 P_ 了 分 别 投影 到 太 与 刺 , 空间 即 忆 ,= 只 了 + ， 
其 中 己 了 为 低 通 部 分 而 吃 矿 为 商 频 细微 信号 部 分 旦 已 es 克 - 

设 尺度 函数 gp(D 的 位 移 集 合 {&t 一 中 } 展 延 出 芒 空 间 ， 则 集合 他 (2 -由 } 展 延 出 太空 间 。 
因 荡 ， 由 包含 性 知 g9 可 表示 成 朵 24- 且 的 线性 组 合 ， 或 


WOD = 2 习 肌 (站 825 一 由 (4.11-15) 
同 理 小 波 函 数 也 可 写成 
wy(D = 2 页 ( 站 828 一 可 (11-16) 


其 中 态 全 与 记 人 为 内 部 尺度 基底 系数 (interscaie basis coe 仙 cients) 


太 (四 -人 je -md (4.11-17a) 


而 四 = 革 jw 人 juo-m (4.11-17b) 
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当 信 叶 在 太空 间 上 ， 且 集合 {gG -如 展 延 出 巧 空间. 则 了 可 表示 为 


JJ 四 = coibG -了 = ceo 矶 人 (4.11-18) 
其 中 

co ={( 太 向 = | AGO6G 一 md; (1-19) 
而 “为 信和 叶 序 列 数 。 信 号 投影 可 用 闻 空 间 基 底 的 线性 组 合 表示 

JD=BF+CA= 六 + 六 =》c 册 人 们 + 直人 (4.11-20) 
其 中 G=2y(2-“t 一 由 。 因 此 尺 广 系 数 < ,和 小 波 系 数 迟 为 

1 1 1 了 
ci = 人 = 访 JA 人 (4.11-23) 
ds ={ 及 水 )- 训 Jo 全 直 。 (人 .11-22) 
1m 印 放 产 1 中 员 2 


因为 7 的 = 大 的 + 天 加 ， 所 以 (大和 =( 记 和 ( 六 和) ， 又 及 与 办 正 交 ， 故 
{ 记 页 =0， 因 此 (六 由 小 = (大 ,和 =cw ， 刚 由 (4.11-21) 与 (4.11-15) 式 可 得 


co = AGO 写 (D8E -2 月 d 
击 
= 2 也 加 | Op -22 有 入 = 了 帮 介 ，coons 


= 从》 及 化 -2m :cos (4.11-23) 
同 理 林 得 
做 一 2 间 cos (4.11-24) 


cu 与 如 ,为 信 呈 7 了 (可 视 为 cu ) 做 小 波 变换 的 第 一 层 系数 ， 尔 后 再 以 cj。 为 下 一 层 的 信号 输入 
青 行 小 波 变换 ， 依 此 类 推 即 可 得 小 波 变换 多 重 分 解 . 由 (4.11-23) 及 (4.11-24) 式 可 知 实现 小 波 
变换 的 演算 方式 应 如 图 4.11-6 所 示 ， 其 中 久 (m 和 广 ( 四 即 是 分 频 滤 波 器 组 的 系数 。 


入 (= 用 (- 癌 


C0m 


六 (= V25(- 癌 


注 ， 贺 形 符号 代表 缩减 取样 ， 即 每 两 点 输 人 保留 一 个 点 当 和 输出， 
图 4.11-6， 第 一 雇 多 解析 信和 号 分 解 
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现在 考虑 合成 的 部 分 。(4.11-17a) 式 的 内 部 尺度 基底 系数 可 推 得 如 下 - 由 {4.11-15)] 式 可 


得 
了 
让 ?2 (HL 一 各 (4.11-25) 
故 
日 dt 直 2 和 (80 一 D9406 -有 
= 也 2 加 | 弛 -64- 有 出 
是 
= 了 2 入 ( 曲 5 =? 加 (4.11-26) 
二 
内 此 
太 (站 = 3 人 jc- 站 出 (4.11-27) 
同 理由 (4.11.16) 式 开始 亦 可 得 
帮 (m) = 了 人 je- 丰 d (4.11-28) 
系数 上 ,可 写成 
con (大 由 =( 用 机 + 有 机 (4.11-29) 
其 中 
(OfO0d=jO2cngu 人 Gd 
了 
= Ze 元 | 60 一 of 一 +] td (4.11-30) 
由 作 .11-27) 式 可 知 上 式 中 的 积分 等 于 2 和 (一 20 。 因 此 ， 
《各 = 2 cu 友人 -2 有 (人 .11.31) 
同 理 可 证 
(及 本 =VY2 4 人 -2 有 (4.11-32) 


结合 人 .11.29、 人 4.11-31) 及 人 4.11-32) 式 可 得 如 图 4.11-7 的 信 生 重建 方式 。 
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注 : 图形 符号 代表 扩 增 采样 ， 即 每 两 点 中 水 一 个 零 进 去 - 
国 4.11-7 ”第 一 屋 多 解析 信和 号 前 秆 于 


4.11-4 二 维 离散 小 波 变 换 


由 于 静 于 图 像 为 二 维 的 信号 ， 故 有 必要 将 前 一 节 的 一 维 状 况 推 广 至 二 维 。 最 常 采用 的 方 
式 是 二 维 可 分 离 小 波 变换 ， 亦 即将 二 维 小 波 变换 以 二 个 一 维 的 小 波 变 换 来 实现 。 相 关 的 小 波 
和 母 函 数 变 成 
看 切 三 关 天) 克 () 
区 (及 = 区 WO 


) (4.11-33) 
We 功 = 外) 
Y (5 太 =wOOWCO) 
其 中 名 加 与 w( 分 别 为 一 维 的 尺度 与 小 波 函 数 。 此 时 ， 
ee 站 123wenx-o2ny -可 7=1.2,3 (4.11-34) 


为 规范 补 交 基底 。 

同上 一 节 ， 实 现 离散 小 波 变 搞 比 较 简 单 又 有 效率 的 方式 是 通过 相对 应 的 滤波 器 来 达成 。 
将 原先 对 一 维 信号 所 用 的 滤波 器 分 别 对 用 在 二 维 信号 的 行 与 列 ， 可 达 卫 维 离散 小 波 变 换 的 效 
果 。 整 个 第 一 层 分 解 与 重建 过 程 分 别 如 图 4.11-8 与 4.11-.9 所 示 . 注意 到 行 与 列 交错 实施 的 部 
分 ， 否 则 图 像 无 法 重建 成 功 。 


矿 人 败 





图 4.11-8 离散 小 该 变 接力 像 的 分 解 步骤 
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明 4.11-9 离散 小 波 变换 图 剧 的 揪 建 步骤 


图 像 经 过 图 4.11-8 所 示 的 分 解 后 得 到 四 个 子 图 像 方 (x, 六 7 = 1 2, 3, 4， 每 个 子 图 像 都 可 
再 继续 做 第 二 层 的 分 解 ， 因 而 得 到 如 图 4.11-10 所 示 的 分 解 结果 。 


六 人 切 六 人 习 


万 (四 


访 人 及 





(9 原始 图 像 (b) 第 一 步 


下 区 同 | (说 
六 人 


六 《zx 中 
(人 J| 产 全 信 





态 人 四 太 区 胃 





广 ( 菇 让 伟 认 
步 


人 te) 第 二 步 td) 第 三 
图 4.11-10 ”二 维 的 离散 小 波 变换 
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4.11-$ 双 正 交 小 波 变换 


具有 紧 支 桂 (compact support) 的 规范 正 交 小 波 变换 函数 使 乏 对 称 特 性 。 我 们 希望 yb 为 
偶 或 奇 芽 数 。 根据 研究 发 现 ， 如 果 采 用 二 组 小 波 基底 y 人 与 让 ), 前 者 用 来 做 分 解 (或 分 析 )， 
后 者 用 来 做 重建 (或 合成 )， 则 我 们 可 有 具 紧 支撑 的 对 称 小 波 。 两 组 小 波 互 为 对 俩 (dual). 且 
其 小 波 族群 {r， (拉手 { 售 加) 为 双 正 交 (biorthogonab， 亦 即 


(66 (人 11.35) 
双 正 交 变 换 的 分 解 可 写成 

cu =(1D, 0) 或 do =(FDy (4.11-36) 
而 重建 可 写成 

7O= 之 coy 伯 或 /= 之 之 dg 的 (4.11-37) 


两 个 小 波 都 可 做 重建 或 分 解 . 但 其 中 有 一 个 用 在 分 解 时 ， 另 一 个 一 定 要 用 在 重建 。 
双 正 交 变 搞 也 有 相对 应 的 滤 旋 器 来 实现 。 例 如 有 人 选择 B-Spline 困 数 (例如 三 角 本 数 ) 为 
兴 门 而 发 展 出 cos 人 的 多 项 式 函 数 的 百 ,(z] ， 其 中 殖 , (2) 是 滤波 器 脉冲 响应 太 { 站 的 z 变 换 。 


4.11-6 小 波 包 


在 多 解析 度 分 析 当 中 ,每 次 输 人 信和 号 的 频谱 都 被 分 成 低 或 高 的 频带 ， 其 中 高 频带 直接 变 
成 输出 、 低 频带 则 继续 再 分 解 成 两 个 子 频 带 ， 依 此 类 推 。 如 果 每 次 频带 分 解 不 一 定 只 能 有 两 
个 频带 ， 而 且 不 一 定 只 有 低频 带 被 分 解 ， 高 频带 也 可 继续 分 解 ， 则 由 此 观念 所 获得 的 输出 结 
果 就 称 为 小 波 包 (wavelet packetb)。 

从 数据 结构 的 眼光 来 看 ， 原 始 多 解析 庆 的 分 析 对 应 到 一 个 极 不 平衡 的 二 元 择 (binary 
tree)， 小 波 包 刚 可 以 是 平衡 是 完满 (complete) 的 二 元 树 -。 图 4.11-11 的 (g) 与 人 b) 分 别 显 示 这 两 
种 树 状 结构 。 


(不 平衡 人 完满 


图 4.11-11 二 元 树 
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小 波 包 的 好 处 在 于 通过 任意 频带 的 分 割 过 到 任意 频率 解析 度 的 效果 。 通 常 伴随 小 波 包 的 
是 一 个 最 佳 基底 选择 (best bases selectiom) 的 自 适 性 算法 ， 以 便 对 某 一 个 特定 信和 号 找 出 若干 小 
波 包 的 组 合 使 共有 最 适当 的 解析 度 。 换 言 之 则 是 保留 { 或 去 掉 ? 如 侈 4.11-11 (D) 的 完满 二 元 树 
的 一 部 分 . 结果 变 成 不 完满 的 树 状 结构 。 常 采用 的 选取 方式 则 是 以 丧 (entropy) 为 频带 分 割 时 
的 准则 。 

以 下 列举 几 个 精 的 准则 。 在 下 列 氢 述 中 六 为 信号 ， 太 则 表示 上 在 一 规范 正 交 基底 的 系数 。 
任何 精 的 表示 式 瑟 都 必须 是 一 个 相 加 性 的 成 本 困 数 (additive cost functiom 使 得 0 =0 旦 
EC)= 之 EU) 。 


(D Shannon 炳 


ED=- 广 iog0 ) 一 ED)=- 六 IJogC ) (4.1-38) 


并 定义 Diog(O) =0。 
(2) 范 数 乘 寡 精 下 ， 1 过 局 过 2 


克 访 = 一 忆 记 = 之 四 (4.11-39) 
(03) 能 量 对 数 灶 
EL1)=log0 一 BEC)=>liog(P) (4.11-40) 
并 定义 为 log(O) =0。 
(4) 临界 炳 
_ 作风 > 
ED 地 全 守 =aO=4A (4.11-41) 
亦 即 信 号 大 于 某 个 临界 值 2 的 次 数 。 


上 述 焕 函数 在 Matlab 的 小 波 工具 和 精 (wavelet toolbox) 中 都 有 现成 的 函数 库 可 供 使 用 。 事 
实 上 小 波 工具 箱 有 使 用 小 波 变换 所 需 的 各 种 软件 函数 库 ， 包 括 各 种 小 波 变 换 的 滤波 器 系数 的 
产生 、 风 维 小 波 变 换 的 实现 . 小 波 变换 结果 的 显示 以 及 许多 小 波 在 信息 处 理 上 的 应 用 实例 等 ， 
颇 有 参考 价值 。 


习 题 
1.P, 如 为 已 知 ， 试 证 明 当 序列 系数 FUKDD 如 (4.1-0 式 所 示 时 ，(4.1-9) 式 中 的 误差 e. 为 最 


小 。 


2. 续 上 题 ， 证 明基 底 图 像 必 形成 一 忆 = 吕 = 闵 且 上 为 等 的 完全 集 。 
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3, 给 一 个 2x2 变换 矩阵 4 及 图 像 三 ， 


试 计算 变 换 后 图 像 恶 及 基底 图 像 。 

4. 证 明 两 个 函数 卷 积 的 傅立叶 变换 是 它们 的 傅立叶 变换 的 铺 积 。 为 简单 起 见 ， 假 设 所 讨论 
的 为 单一 变量 函数 。 

4.， 试 推导 并 绘 出 8 点 FFT 之 DIT 信和 叶 流 程 图 。 

6. 试 推导 (4.3-30) 与 (4.3-31) 式 - 

7. 试 求 下 列 两 函数 ， 即 / 妇 与 AD ， 在 [0,1)7 上 的 列 率 。 


0 


7 时 


站 1 
8. 试 求 六 =4 时 的 Haar 变换 矩阵 。 


9. 试 求 久 =8 时 的 斜 变换 矩阵 。 
10. 对 下 列 甜 阵 进行 SVD 变换 ， 


用 
1 
4=|2 
1 
1 


1 
kt 有 nm 妇 下 
二 


1 
2 
t 
1 


11， 试 选 一 幅 大 小 为 128x128 的 8 位 灰 度 图 像 做 DFT 变换 、DCT 变换 、 一 层 小 波 变换 。 其 小 
波 变换 之 滤波 器 系数 分 别 为 : 
高 通 分 解 系 数 
[【-02304 07148 -06309 -00280 01870 00308 -00329 -00106] 
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低 通 分 解 系数 

[-001065 0.0329 00308 -01870 -0.0280 06309 0.7148 0.230 4] 
高 通 重建 系数 

[-00106 -00329 00308 0.1870 -0.0280 -06309 0.7148 -0.2304] 
低 通 重建 系数 

[0.2304 0.7148 0.6309 -~00280 -0.1870 0.0308 0.0329 -00106] 


(D 分 别 显 示 其 变换 系数 大 小 的 图 ， 并 打印 之 。 

(2) 分 别 显示 其 变换 系数 的 直方 图 ， 并 打印 之 。 

(3) 分 别 显示 其 反 变换 ( 还 原 ) 图 像 ， 并 打印 之 。 

人 假设 DFT、DCT 和 小 波 变换 系数 由 低频 往 高 频 排列 ， 保 留 前 25% 低频 部 分 ， 其 余 补 


替 ， 将 图 像 还 原 ， 分 别 显示 其 图 形 ， 并 打印 之 。 


(5) 计算 (4) 中 还 原 图 像 与 原 图 像 的 PSNR， 其 中 PSNR 的 定义 为 : 


二 25S3 
峰值 信 曲 比 : PSNR 一 20 log RNWMSE 


均 方 误差 ， RMSE= | 六 六 om- oo 


其 中 rom 为 原始 图 像 ， 产 (0mt 由 为 重建 图 像 . 
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3.] 


5.3 频 域 的 图 像 增 强 法 
5.4 彩色 图 像 增强 


于 
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图 像 增强 技术 的 主要 目的 是 为 了 增加 玫 像 的 视觉 效果 ， 让 人 眼 或 机 器 易于 辨识 。 也 就 是 
说 : 处 理 一 幅 图 像 ， 使 其 结果 对 特定 的 应 用 来 说 比 原始 图 像 更 合用 。 因 此 .图 像 增 强 技 术 对 
已 很 理想 的 图 像 而 言 是 不 太 有 有 效果， 但 对 一 些 失 真 的 图 形 则 有 明显 的 成 效 。 此 外 ， 图 像 增 强 
可 以 防止 图 像 中 所 代表 的 重要 图 父 信 息 的 遗漏 。 例如 ， 一 个 图 像 增强 系统 可 以 利用 高 通 滤波 
器 来 强化 图 像 中 物体 的 边线 . 使 图 中 的 物体 更 加 明显 。 就 像 其 他 图 像 处 理 的 方法 一 样 . 图 像 
增强 技术 没有 所 谓 必 然 最 佳 的 方法 ， 而 是 有 各 种 方法 。 其 中 的 取舍 全 视 应 用 的 需求 ， 以 及 图 
像 本 身 的 特性 。 有 的 图 像 增 强 技术 效果 很 好 , 但 其 结构 却 非 常 的 复杂 ,以 致 于 硬件 难以 实现 。 
有 的 则 效果 略 差 一 点 ， 但 结构 简单 。 本 章 将 介绍 多 种 图 像 增 强 的 方法 。 


5$.1 点 处 理 增 强 


所 谓 点 处 理 (point processing) 系 指针 对 单一 个 像素 强度 的 改变 而 言 ， 这 是 最 简单 的 一 种 医 像 增 
强 技 术 。 以 下 均 假设 输入 图 像 点 像 训 的 强度 为 ， 经 点 处 理 了 后 的 输出 强度 为 g， 即 8 = 开 故 。 


S.1-1 简单 的 灰 度 变换 


最 常见 的 图 像 缺 鸣 是 对 比 度 不 足 ， 其 原因 包括 照明 强度 弱 ， 图 像 感应 器 的 动态 范围 不 
足 ， 甚 至 可 能 在 图 父 撕 了 歌 时 光圈 设 定 不 当 等 、 而 此 缺陷 可 以 经 由 对 每 点 的 像素 ffx, 让 作 振 幅 
重新 调整 比例 (atmplitude rescaling) 加 以 改善 : 图 $.1-1 ( 们 是 一 个 连续 且 低 对 比 度 图 像 的 典型 
振幅 变换 曲线 , 很 容易 看 出 增强 后 比 原 始 图 像 的 对 比 度 提 高 了 许多 . 但 是 这 个 方法 较 难 实现 。 
相对 的 图 5.1-1fb) 量化 振幅 (quantized amplitude) 的 转移 范 数 就 简单 很 多 ， 但 其 代价 是 有 少许 
的 重 化 误 凑 。 


输出 ee 


| co 
j 二 
1 和 
] | 莉 才 者 提 症 半 和 提 扣 扣 


扎 姑 图 依 范 轩 
四) 连 统 图 像 人 o) 量化 图 像 
图 5.1-1 图 像 对 比 谋 增 强 





@ 振幅 调整 

在 处 理 数 字 图 像 时 , 有 时 候 可 能 发 生 处 理 后 的 图 像 与 原始 图 像 的 数值 范围 range) 不 同 的 
情形 ， 甚 至 在 数学 运算 上 产生 含有 负数 的 和 矩阵。 显然 ， 图 像 亮 度 函 数 (intensity fonctiom) 必须 
为 正 数 ， 此 时 无 法 将 矩阵 直接 映射 (mapping) 至 图 像 函 数 的 范围 上 。 图 5.1-2 显 示 以 重新 调整 
振幅 来 解决 此 问题 的 一 些 方式 。 
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输出 
和 出 更 轩 
答 估 范围 输出 
人 线性 图 像 比例 人) 线性 图 像 比例 (章平 ) 
输出 
输 和 
(@) 绝对 值 比例 


图 5.1-2 图像 气 幅 调 整 的 例子 


第 一 种 方法 采 到 线性 变换 ， 并 将 最 负 的 点 令 为 霍 ， 于 是 输出 后 就 没有 小 于 零 的 点 。 然 后 
可 以 将 输出 在 0 到 1 之 间 做 妇 一 化 。 第 二 种 方法 类 似 第 一 冲 ， 但 是 它 设 了 两 个 极 眼 ， 输 和 人 小 
于 极 小 值 x 与 输 人 超过 极 大 值 2 以 后 都 前 平 (clip)， 规 一 化 后 分 别 是 极 小 值 0 与 极 大 值 1、 而 
中 间 部 分 仍 是 线性 变换 , 第 三 种 方法 则 是 将 输入 值 取 钨 对 值 ， 如 此 一 来 也 能 避免 负数 的 产生 。 
一 般 来 说 ,最 受 欢 迎 的 是 第 二 种 方法 ， 它 的 效果 会 比 第 一 种 好 很 和 多， 尤其 是 当 图 像 中 的 像素 
都 介 于 线性 e 至 的 区 用 内 时 。 之 前 已 经 提 过 ， 对 比 度 不 足 是 图 像 最 常见 的 问题 ， 对 比 麻 
不 足 表示 图 像 的 直方 图 (histogram) 集中 在 小 范围 内 . 正 符合 第 二 种 方法 的 特性 。 若 此 时 采用 
第 一 或 是 第 三 种 方法 只 能 将 负 的 值 变 成 正 值 ， 对 于 图 像 的 清晰 度 并 没有 帮助 ， 这 应 是 第 二 种 
方法 受 欢迎 的 原因 。 

下 面 举 一 个 第 二 种 方法 的 实例 , 直接 以 图 像 的 喜 方 图 来 比较 . 我 们 知道 图 像 对 比 度 越 高 ， 
其 图 像 函 数 的 直方 图 分 布 越 广 。 图 5.1-3(a] 是 原始 图 像 的 直方 图 ， 其 分 布 约 在 0.20 ~ 0.40 之 
间 . 其 余 的 地 方 亮度 都 为 零 。 这 是 对 比 度 很 差 的 一 幅 图 像 。 图 5.1-3 人 b) 则 取 最 小 值 0.17， 最 
大 值 为 0 人 4 做 处 理 ， 并 重新 调整 比例 鞋 0 与 1 之 间 ， 但 是 效果 仍然 不 显著 ， 因 为 原始 图 像 0.40 








1 0 ! 
{a) 原始 直方 图 (b) Min,clip = 0.17, Max.clip = 作 64 
图 5.1-3 线性 琐 像 调整 ( 剪 平 ) 的 实例 ( 待 统 ) 
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0 1 
(9 Minclip = 0.24, Max.clip = 0.35 
图 5.4-3 ( 续 ) 
至 0.64 之 间 亮 度 全 是 零 , 在 重新 调整 比例 后 亮度 为 零 的 区 域 仍 然 很 大 , 也 就 是 说 对 比 度 没 有 提 
高 多 少 。 可 以 发 现 (ec) 的 效果 最 好 ， 它 取 最 小 信 为 024， 最 大 值 为 0.35， 这 相当 于 上 下 切 去 下 
分 之 五 的 比例 ， 因 此 所 有 的 点 都 在 线性 范围 内 。 至 于 切除 的 百 分 之 五 ， 人 眼 根本 观察 不 出 来 。 
这 个 例子 说 明 ， 对 比 度 不 足 的 图 像 ， 用 带 章 平 的 线性 图 像 比 例 重新 调整 可 以 非常 有 效 。 
二 对 比 度 修正 (Contrast Modificatiom) 
上 述 振幅 调整 只 适用 于 对 比 度 集中 在 一 小 范围 的 图 像 ， 并 不 适合 动态 范围 大 的 图 像 ， 此 
处 所 需 证 论 的 对 比 修正 则 专门 处 理 对 比 度 范 围 宽 广 的 图 像 。 接 下 来 将 介绍 几 种 方法 并 比较 其 
优 缺 点 及 适用 场合 。 
0) 辕 痰 律 志 变换 (Power Law Point Transformations) 
这 种 方法 的 数学 定义 为 
gs=[r G.1-D 


其 中 了 指 原始 图 像 的 图 像 函 数 ，P 是 次 方法 则 的 变量 。 通 常 来 说 ， 平 方 如 = 了 3) 效果 最 好 。 图 
5.14 分 别 晶 示 出 平方 、 立 方 、 平 方 根 以 及 立方 根 四 个 转移 函数 。 





加 平方 函数 





te) 平方 机 函数 (可 立方 杠 菌 数 
一 5.1-4 次 方 函数 实例 
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(2) 分 段 线性 函数 RubberBand Fonctiom) 

次 方 函 数 是 常用 也 是 效果 较 好 的 方式 ， 但 是 我 们 希望 能 有 一 种 线性 且 容 易 实 现 的 方法 议 
降低 计算 成 本 ， 可 是 效果 又 不 能 太 差 。 如 图 5.1-5 所 示 的 分 段 线性 函数 则 可 以 满足 以 上 的 要 
求 。 







图 5.1-5 分 角 线 性 函数 


(3) 高斯 误差 函数 【Gaussian Error Functiom) 
图 5.1-6 表示 高 斯 误差 函数 ， 在 了 小 的 时 候 (图 形 前 端 ) 它 的 表 班 像 平 方 郴 数 ， 在 三 大 的 
时 候 (图 形 后 端 ) 它 的 表现 俐 平方根 函数 。 其 数学 定义 为 








ca5] 05 
呈 一 2Cr 2 (5.1-2) 
erf 105 
Do 
其 中 
cd 的 = 天 人 ep(jiy G.1.3) 
吕 则 为 高 斯 分 布 的 标准 差 





图 5.1-6 高 斯 误差 函数 


(4 个 冰 数 [Reverse Funetion) 与 反 函 数 (Inverse Functiom 
倒 函 数 或 反 函 数 都 可 以 将 明暗 度 反 转 ， 也 就 是 原本 最 暗 的 地 方 变换 后 变 成 最 亮 。 其 数学 
定义 如 (5.1-4) 与 (3.1-3) 式 所 示 ， 其 图 形 则 如 图 5.1-7 所 示 。 很 容易 看 出 倒 函 数 是 线性 的 ， 而 
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反 上 函数 则 是 非 线性 。 这 种 亮 暗 交 换 的 功能 形成 图 像 底片 的 效果 ， 可 用 在 医学 图 像 的 显示 与 纪 
灯 片 的 制作 等 。 


倒 表 数 :， &=10- 上 了 (5.1-4) 
T0， 40s 太 <0 
反 画 数 : 8 二 0 三 广 <1.0 6G13) 


F 思 rt 
-了 1 本 广 
| 人 | | 
[ellLLLLLIILLL 





到 国 
二 二 二 十 十 二 ES 叶 二 FHHTEEb 


ta) 倒 函 数 (tb 反 琢 数 
图 5.1-7 亮 瞳 函数 


e@ 动态 范围 压缩 
有 时 候 经 处 理 后 的 图 像 的 动态 范围 大 到 只 能 显示 出 几 个 像素 ， 例 如 对 图 像 取 傅立叶 变换 

后 的 系数 。 通 常 我 们 采用 以 下 的 强度 变换 函数 
8=cloguot+|1AD) (5.1-0 


其 中 。 为 一 常数 。 恨 设 傅立叶 频谱 的 范围 为 [0, sx 109]， 则 log (t+17) 的 范围 为 0 到 的 
67。 根 设 我 们 有 一 个 8 位 的 显示 系统 ， 即 显示 范围 为 0 到 255， 因 此 常数 ec 的 选择 是 
25576.7=38 。 

@ 灰 度 切割 {Gray-Level Slicing) 


此 方法 的 目的 是 只 强调 某 范围 的 灰 诺 ， 可 用 来 加 强 图 像 中 某 些 特 定 物 体 的 特征 ， 例 如 将 
卫星 照片 中 的 海水 部 分 或 云 的 部 分 凸显 出 来 。 所 采用 的 基本 变换 函数 为 


_ |， 了 三 让 

5 其 他 情况 6 
或 

| 二 ， as 了 二 

-人 其 他 情况 6 3) 


此 变换 函数 的 曲线 分 别 如 图 5.1-8 的 人 a) 与 人 b) 所 示 。 
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fa) 加 强 在 [xb] 内 强度 的 像素， 并 把 其 他 tb) 加 强 在 [ea, 避 内 强度 的 像素 ， 
恤 素 的 强度 定 为 较 低 的 常数 值 其 他 俐 素 不 变 


图 5.1-B8 灰 庆 切 偶 
龟 位 平面 切割 (Bi 让 Plane Slicing) 


假设 图 像 的 每 一 个 像素 都 均匀 量化 成 中 位 ， 则 从 最 低 次 罪 位 (LSB) 到 最 高 次 匀 敌 恒 
(MSB)， 所 切割 的 位 平面 可 想 成 如 图 5.1-9 所 示 的 情况 。 


人 某 个 像素 所 对 
下 


位 平面 .1 应 的 位 


(MSB 平面 


yy 
位 平面 0 


(LSHB 平面 ) 
转 5.1-9 一 个 妊 位 图 称 的 位 平面 表示 
令 一 下 位 图 像 表 示 成 


了 = 六 82 (5.1.9) 


测 从 MSB 平面 起 算 的 第 ”个 位 平面 可 由 下 式 获得 


全 若 上 =1 
5 = 


-10， 其 他 情况 6) 


5.1-2 直方 图 修整 (Histogram Modification) 


一 个 图 像 的 直方 图 g 访 代表 其 度 为 三 的 像 训 的 个 数 除 以 总 像 率 所 形成 的 函数 ， 可 视 为 
概率 密度 函数 的 一 个 佑 测 。 直 方 图 处 理 的 目的 是 将 原 图 像 的 直方 图 修整 成 某 个 所 要 的 形式 。 
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例如 可 将 具有 狭窄 直方 图 的 低 对 纪 度 图 像 延 展 其 间 方 图 变 成 对 比 度 较 高 的 图 像 而 达到 图 像 增 
强 的 自 的 。 
里 直方 图 均衡 化 

直方 图 均衡 化 的 目的 是 希望 获得 一 个 均匀 分 布 站 方 图 的 输出 图 像 、 设 变量 矿 代 表 像 素 灰 
度 大 小 在 [六 ,矿区 和 间 的 一 个 变量 。 考 起 如 下 的 变换 

g= 了 TD (5.1-11) 

此 变换 必须 满足 直列 两 个 条 件 : 

(人 TCm 在 ji 至 太太、 的 区 间 上 是 单调 递增 的 。 

人 2) 对 于 Am 至 乒 冯 太 Soi 半 T 方 呈 Boaro 
将 /与 8 视 为 随机 变量 ， 其 概率 密度 函数 分 别 为 Pi( 方 与 可 的。 由 基本 的 概率 理论 可 知 





pe- pr6d G.1-12) 
即 两 边 的 累积 分 布 函数 相等 ， 记 为 已 (8) = PC/) 。 考 虑 如 下 变换 
TU)= 户 (= 六 rd (65.1-13) 
显然 此 函数 泣 足 上 述 (1) 和 (2) 的 条 件 : 
假设 输出 是 概率 密度 函数 如 下 的 均匀 分 布 
Pa 8) ， gm 所 中 迄 au (5.1-14) 
局 mm 一 品 min 


则 由 全.1-12) 到 (5.1-14) 式 可 得 如 下 变换 函数 

8 人 (gon 一 gmn 和 pi( 门 +8m [5.1-15) 
将 上 述 观 念 延 伸 到 灰 度 在 【六 , 广 。] 的 真实 图 像 来 。 上 现在 是 有 限 个 离散 值 ， 原 先 概率 密度 
函数 变 成 下 列 概率 


pr(])= 工 ， 人 (5.1-16) 


其 中 恬 表示 灰 度 y 出 现 的 像素 个 数 ，#” 则 为 所 有 像素 的 个 数 。 因此 (5.1-13) 式 的 离散 形式 为 


T(.A)= PCD-= 立 二， 了 (5.1-17) 


Ja 


将 此 结果 代 人 (5.1-13) 式 即 得 均衡 化 变换 后 的 输出 为 
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8=(Snw -ge ) 六 于 十 Ba， Ju 了 反方。 (5.1-18) 
六 
和 直方 图 修整 
在 直方 图 均衡 化 中 ， 我 们 希望 输出 的 概率 密度 函数 为 
py 地)= 1 


有 aa 一 人 
我 们 也 亲 以 得 到 站 方 图 依 其 他 的 输出 所 需 的 概率 密度 修整 ， 如 表 5.1-1 所 示 。 


囊 5.1-1 直方 图 的 输出 概率 密度 及 其 相对 应 的 变换 函数 
输出 概率 密度 模型 
均匀 型 (Uniformy 





1 
Pi kg) = 7 旦 一 (gm 一 Bar 门 十 San 


mx 一 总 mm 

指数 型 (Expoenentialy 
P(8)= aexp[F atg-guuj] 吕 = gm -二 nt-P0D] 
雷 利 型 避 ayleisb) 
加 号 mn 


他 -8 1 


PKB]) = 一 Seex 3 | | 
攻 八 20: 如 有 mm 代 1 一 己 ( 亡 


立方 根 型 (Cube Roeb 


一 


1 
户 亿 -3 二 而 JPCD+ 


对 数 型 [Logarithimic) 


1 WTA 
= = aa 
CT 8 -| 全 





急 指定 直方 男 (Histogram Specificatioty 


虽然 直方 图 均衡 化 或 直方 图 修 糙 是 很 有 用 的 方法 ， 但 是 因为 只 是 产生 具有 近似 几 个 概率 
密度 的 结果 ， 并 不 太 送 合 做 交互 式 (interactive) 图 像 增强 。 有 时 我 们 需要 有 特定 形式 的 直方 
图 ， 以 便 突 昂 某 段 灰 庆 值 的 范围 。 

同 (5.1-13) 式 ， 假 设 所 需 的 输出 概率 密度 函数 为 pg(g)， 定 义 其 标 积 分 布 函 数 所 构成 的 变 
换 如 下 


RG)= 已 G@)= 六 pe)d CGI) 
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由 (5.1-12) 、(S.1-13) 与 (5.1-191? 式 可 得 
RGB)=T(7) 6129) 
国 而 待 求 的 灰 度 8 可 写成 


g8=Rn Fr( (5.1-21) 
接着 讨论 上 述 观 念 的 离散 版 本 。 首 先 定义 


TO)- > 卫 ， JS 和/ 和 如 065.1.23) 


RE)= 补 生 ， gu sg (65.1.23) 
我 们 要 决定 的 是 了 到 g 之 间 的 对 应 。 给 一 了 上 值 ， 由 (5.1-22) 式 可 得 7 .然后 由 (5.1-23) 式 
找到 一 最 小 的 g 值 使 得 Rig) 基 FL 六 ， 此 8g 值 即 为 了 的 对 应 值 。 


@ 局 部 增强 
一 个 图 像 的 直方 图 是 贸 像 总 体 的 统计 特性 ， 依 此 特性 所 得 的 贸 像 增强 效果 ， 对 整体 而 言 
或 许 有 不 错 的 平均 表现 ， 但 是 对 图 像 的 某 些 部 分 未 必 最 佳 ， 由 此 衍生 出 局 部 增强 的 概念 。 
一 般 局 部 增强 的 做 法 是 以 待 处 理 像素 为 中 心 连 同 其 周边 若干 像素 形成 直方 图 ， 再 采用 先 
前 所 述 的 直方 图 均衡 化 或 指定 直方 图 等 的 方法 。 


5.1-3 ”其 他 点 处 理 法 


鲁 方差 均衡 化 

直方 图 均衡 化 郊 目 标 是 希望 输出 有 近似 均 久 的 概率 密度 隔 数 ， 而 方差 均衡 化 则 希望 获得 
均匀 的 方差 。 这 个 做 法 适合 局 部 增强 ， 可 使 对 比 度 或 方差 过 低 的 才 均 匀 部 分 突显 出 披 此 的 差 
异 。 考 虑 一 中 心 为 Ar 有 的 局 部 图 像 。 设 Ai 有 所 对 应 的 变换 点 为 gtx, 力 ， 则 

go)=-2L [Jennyj 和 me (5.41.24) 
Of J 

其 中 mx 及 与 cc 妇 分 别 为 此 局 部 图 像 的 灰 麻 平均 值 与 偏差 量 ，1 是 整 幅 图 像 的 灰 摩 平 
均 ， 而 是 在 0 与 工 之 间 的 调整 参数 。 当 偏差 量 afz, 六 小 的 时 候 ，Fx, 攻 与 mlx, 访 的 差异 量 
可 获得 较 天 的 放大 倍率 ， 而 达到 加 大 对 比 度 的 效果 。 
名 图 像 相 减 


将 两 图 像 逐 点 相 减 也 是 一 种 图 像 增强 的 方式 。 例 如 ， 以 身体 某 部 分 的 医学 图 像 为 对 象 ， 
再 注 人 特殊 感光 化 学 液体 至 血 符 中 所 得 的 画面 与 其 相 减 ， 将 相 减 过 的 画面 连续 播放 ， 就 可 看 
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出 这 些 化 学 液体 是 如 何在 血管 中 流动 的 。 
图 你 平均 

作 设 一 个 图 像 感应 器 受到 竺 均值 为 零 的 高 斯 噪声 的 影响 ， 因 此 得 到 的 是 带 品 声 的 图 虱 。 
有 一 个 销 除 此 噪声 的 方法 就 是 对 同一 画面 多 取 几 张 图 像 , 再 取 这 些 图 像 的 平均 图 像 . 理论 上 ， 


由 于 所 受到 的 是 平均 值 为 零 的 高 斯 图 像 ， 求 平均 的 作用 可 抵消 噪声 的 效应 ， 而 且 用 的 图 像 念 
多 效果 愈 好 。 


.2 空间 滤波 


求 用 模板 (masky 逐 点 对 图 像 做 处 理 的 方法 称 为 空间 让 波 , 这 是 相对 于 采取 如 傅立叶 等 变 
换 所 得 的 频 域 滤波 法 丽 言 。 


S.2-1 平滑 滤波 


平滑 滤 波 器 本 质 上 是 一 个 低 通 滤波 器 ， 它 主要 用 来 使 图 像 模糊 或 降低 噪声 。 对 图 像 识别 
的 目的 而 言 ， 图 像 模糊 可 去 除 妨 碍 重要 特征 抽取 的 小 细节 并 使 断 线 相连 。 对 于 脉冲 型 的 高 频 
噪声 ,平滑 滤 波 将 可 减轻 此 噪声 的 效应 。 


昌平 均 滤 波 
一 个 3x3 平均 滤波 器 所 采用 的 模板 如 图 5.2-1 所 示 ， 由 此 图 可 明显 看 出 其 名 称 的 由 来 。 


一 般 带 用 的 还 有 5 x5 或 7x7 的 模板 。 愈 大 的 模板 模糊 效果 愈 强 ， 相 当 于 此 让 波 器 的 截止 频 
率 愈 来 您 低 ， 商 频 部 分 被 滤 去 您 多 。 


1 
1 1 1 
1 1 1 








责 5.2-{ 3x3 平 均 滤 波 器 模板 
鲁 中 值 滤波 器 


平均 站 波 往往 不 只 是 把 干扰 去 除 ， 还 常 把 图 像 的 边缘 变 模糊 ， 因 而 造成 视觉 上 的 失真 。 
如 果 目 的 只 是 要 把 干扰 去 除 ， 而 不 是 刻意 让 图 像 模 糊 ， 则 中 值 滤波 是 很 好 的 选择 。 

首先 把 柳 板 内 所 涵盖 的 像素 灰 度 值 由 小 到 大 排列 ， 中 值 是 指 排序 在 中 间 的 那 一 个 值 , 此 
值 即 为 滤波 恬 的 输出 。 此 法 特别 适合 用 在 有 很 强 的 胡椒 粉 式 或 脉冲 式 的 干扰 时 ， 因 为 这 些 灰 
度 值 的 干扰 值 与 其 邻近 像素 的 灰 度 值 有 很 大 的 差异 ， 因 此 经 排序 后 取 中 值 的 结果 是 强迫 将 此 
干扰 点 变 成 与 其 邻近 的 某 些 像素 的 灰 度 值 一 样 ， 达 到 去 除 干扰 的 效果 。 由 中 值 小 波 器 的 原理 
不 难 钻 出 中 值 滤波 是 一 个 非 线 性 的 操作 。 

必 一 种 非 线 性 的 做 法 是 先 计算 局 边 像素 灰 度 的 平均 值 ， 若 所 考虑 的 像素 的 灰 度 与 此 平均 
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值 差异 量 超过 一 定 的 临 异 值 ， 则 判定 此 像素 为 于 扰 ， 而 用 先前 计算 所 得 的 平均 值 来 代替 。 


S.2-2 ” 锐 化 滤波 


馈 化 {fsharpening) 滤波 本 质 上 是 一 个 高 通 滤波 器 它 主要 用 米 使 图 像 的 细节 (detai 或 边缘 
更 罕 显 ， 而 达到 图 像 增强 的 中 的 。 
鲁 基本 高 通 空 间 滤波 

一 个 3x3 高 通 空间 让 让 器 所 采用 的 模 极 如 图 5.2-2 所 示 。 若 模板 中 心 点 对 应 具有 较 大 
其 度 的 像素 ， 则 经 此 滤波 后 ， 此 公 素 与 其 旁边 像素 之 间 的 灰 度 的 差异 会 被 放大 ， 反 之 ,此 
模 极 对 灰 度 变化 相当 慢 的 平滑 区 域 ， 其 输出 将 非常 小 。 极 端 状况 是 若 模 艇 所 涵盖 范围 内 的 
其 度 都 一 样 时 ， 则 不 管 原 来 是 多 大 灰 度 值 ， 其 输出 恒 为 零 ， 这 表示 此 种 模板 有 降低 整体 图 
像 平 均值 使 留 像 整 体 变 暗 的 缺点 。 另 外 ,实际 的 输出 有 负 值 的 可 能 性 ， 必 须 做 大 小 的 调整 。 
-1 -1 -1l 








图 5.2-2 3x3 高 通 空 间 下 波 器 模板 
名 商 频 加 强 (High-Frequency-Emphasis) 小 波 
此 种 滤波 是 先 将 原始 图 像 乘 上 一 个 大 于 :1 的 倍率 再 减 去 此 图 像 经 低 通 滤 波 后 的 结果 。 志 


种 滤波 器 的 一 个 3 x 3 模板 如 图 5.2-3 所 示 ， 其 中 wx 为 放大 倍率 。 注 意 到 ec = 1 时 ， 此 结果 与 图 
5.2-2 中 所 示 的 模 松 完全 一 样 : 





5.2-3 3x3 高 频 加 强 滤波 器 的 模板 
昌 差分 型 滤波 器 
差分 (differencing) 型 滤波 器 的 主要 概念 是 将 图 像 物 体 的 边缘 (edge) 与 其 邻近 像素 间 的 
其 度 加 以 放大 ， 达 到 凸显 物体 边缘 轮廓 的 图 像 增 强 效 果 。 此 种 方法 亦 可 作为 图 像 分 割 中 检测 
物体 边缘 之 用 。 
最 常见 的 差分 型 让 波 器 是 利用 梯度 的 方法 。 对 于 一 个 函数 rex, 诱 ， 其 梯度 为 
Br ， 尺 


本 (5.2-]1) 


其 大 小 为 
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罗 =( 产 + (5.2.2) 
对 于 一 个 离散 型 画 数 .Ar, 四 .类似 (5.2-2) 式 的 梯度 的 大 小 定义 为 
了 网 =( 关 + 挛 本 (5.2-3) 


其 中 户 代 表 严 的 方向 ( 列 的 方向 ) 上 的 梯度 分 量 , 乓 则 代表 n= 方向 ( 行 的 方向 ) 上 的 梯度 分 
量 。 有 时 为 了 节省 计算 量 ， 我 们 采用 








18=| 六 + (5.2-4) 
代替 (5.2-3) 式 。 
最 简单 的 离散 型 梯度 表示 是 相 邻 像素 灰 度 间 的 差 量 。 例 如 列 方向 上 的 梯度 分 量 为 
六 = 由 -Ar+lm (52-5) 
而 行 方 向 上 的 梯度 分 量 为 
六 = 人 -Fa (5.2-6) 


以 3x3 模板 表示 ， 则 分 别 如 图 5.2-4 的 (8) 与 b) 所 示 。 


0 0 90 0 0 0 

0 1 8 -1 1 0 

0 -1 4 0 0 0 

人 @) 列 方向 他 ) 行 方向 

围 5.2-4 ”实现 习 度 分 量 的 一 个 3x 3 模板 
其 他 常 匈 的 模板 如 图 5.2-5 所 示 。 

运算 模板 列 方向 行 方 向 
0 1 0 0 0 0 
隔 点 灰 庶 莽 0 0 0 -1 0 1 
0 -1 0 0 0 0 
0 0 0 0 0 0 
Roberts 0 1 0 0 1 0 
0 0 -1:1 -1 0 0 
上 [1 1 1 1[-1 0 1 
了 Prewr 放 一 | 站 如 站 一 -1 0 1 
3 -1 -1 -1 3 -1 0 1 
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1 2 1 1 一 1 0 1 
Sobel 工 0 0 用 了 -2 0 2 
41-1 -2 -1 -1 0 1 
1 1 -1] 0 0 

_ 1 1 
Frei-Chen 一 一 一 | 0 全 0 天 0 0 
2+ 必 2 1 -2 | 2+ 愉 -1 0 站 





图 5.2-5 常见 的 梯度 模板 运算 


5.3 ” 频 域 的 图 像 增强 法 


对 一 图 像 进 行 傅立叶 变换 后 .物体 边缘 或 灰 度 变动 较 剧 烈 的 部 分 反应 在 傅立叶 系数 中 的 
“高 频 部 分 ”( 即 坐标 较 大 者 )， 平 滑 的 部 分 则 反应 在 傅立叶 系数 中 的 “低频 部 分 ”( 即 坐标 较 
小 者 )。 依 此 原理 ， 阁 要 到 低 通 滤波 的 效果 ， 可 将 较 高 频 部 分 的 系数 衰减 其 大 小 ， 甚 至 全 部 为 
零 ， 再 对 所 有 处 理 过 的 变换 系数 取 反 傅立叶 变换 即 可 得 到 低 通 滤波 的 效果 。 反 之 ， 若 要 育 高 
通 滤波 的 效果 ， 则 将 较 低 频 系 数 衰减 - 


$.3-1 ”由 频 域 指定 滤波 器 特性 
设 rm, 四 为 原 图 像 ，Am,) 为 滤波 器 的 脉冲 响应 ，g (mm, 四 为 图 像 滤 波 后 的 结果 ， 则 


5 四 = Fr,njr ion (3.3-1) 
其 中 * 代 表 卷 积 。 对 (65.3-1) 式 取 傅立叶 变换 可 得 
三 优 , 门 = 严 人 大 门 瑟 全 ,站 (5.3- 人 2 


因此 在 频 域 中 ， 我 们 可 依 不 同 态 & 0 的 选择 来 达到 低 或 高 通 滤波 的 效果 。 
例如 


忆 优 , 门 过 忆 


1]， 
有 0) 相 D 化 门 > D， 3 3) 
代表 一 个 理想 的 低 通 滤波 器 ， 其 中 Duo 称 为 截止 频率 ,而 
D 优 门 = 仆 : + (5.3-4) 
代表 点 做 六 到 原点 间 的 欧 儿 里 德 距离 。 同 理 ， 理 想 的 高 滤波 器 为 
0， D 全 站 和 Do 
zk0- 人 pp)>D， (5.3-S) 
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由 连续 函数 的 傅立叶 变换 对 


1， | 生长 1 
0， | 驯 |>1 


19-sOe ro-| 


我 们 可 以 推测 囊 代 门 的 反 变换 闫 (mm 由 必然 是 一 个 如 sin 人 (人 77 的 取 祥 (samplin 引 旺 数 ， 由 
(5.3-9 式 可 推测 出 所 得 的 结果 会 有 所 谓 的 拍 铃 (ringin 自 效应 ， 因 此 我 们 据 弃 理想 滤波 器 而 采 
用 实际 盖 波 器 ， 例 如 低 通 与 高 通 巴特 闫 斯 人 Butterworth) 手 波 器 分 别 为 


] 


0 让 思念 7D 下 


(5.3-6) 


五 化 站 = (5.3-7) 


1 
1+ 四 7D 优 避 

其 中 代 表 阶 数 ，n 愈 大 滤波 器 响应 变化 傅 快 速 ， 反 之 则 您 慢 。 
5$.3-2 ” 同 态 (Homomorphic) 滤 波 


假设 一 个 图 像 fm, 四 可 上 由 光 强 度 io 四 与 物体 反射 光 强 度 ”Com, 站 的 分 量 乘积 来 决定 ， 
即 


nm)=Hm rm (3-8) 
将 (5.3-8) 式 取 对 数 可 得 
inLreo, 训 = lnEon,zj+lnren om (35.3-9) 


一 般 而 言 ， 光 的 强度 分 量 Fn 站 对 所 有 (mm 对 而 言 均 为 定 值 或 变化 很 缓慢 ， 而 反射 兴 强 度 分 
量 (wm 站 则 变化 较 大 ,特别 是 在 不 局 物体 间 的 交接 钼 。 因 此 若 对 (5.3-9) 式 取 傅 立时 变换 . 则 
低频 傅立叶 系数 反应 在 mnfiftm, mLEF ， 高 频 傅 立时 系数 则 反应 在 Infr(m, 员 上 。 
接 下 来 我 们 可 依照 上 节 的 观念 ， 指 定 所 需要 的 滤波 器 特性 ， 设 为 互 5D。 则 由 (5.3-9) 式 
可 得 
五 民 门 . 3fmn[ An 六 瑟 谎 :3fmEon 可 坟 五 大 门 ， 2nor mo 
(5.3-10) 
这 表示 我 们 所 取 的 滤波 器 互信 六 可 分 别 改变 光 强 度 与 反射 光 强 度 的 特性 ， 因 比 我 们 可 以 做 
到 局 时 降低 图 像 动态 范围 (低频 处 瑟 优 站 < 坊 ， 又 增加 对 比 度 (高 频 处 五 号 > 1) 的 结果 。 
最 后 的 程序 是 要 将 (5.3-10) 式 取 反 情 立时 变换 后 再 取 指 数 函 数 ， 才 得 到 图 像 增 强 后 的 结 
果 ga]。 整 个 流程 图 显示 于 疼 5.3-1 中 。 
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窗 S.3.1 ” 周 态 滤波 图 像 增强 法 的 流程 图 


5.4 彩色 图 像 增强 


将 彩色 用 到 图 像 处 理 中 有 两 个 主要 原因 : 
中 在 月 动 化 图 像 分 析 中 , 彩色 是 一 种 有 效 的 描述 , 这 种 彩色 描述 常常 可 简化 目标 识别 以 
及 从 背景 中 提取 目标 的 工作 。 

他 以 人 做 图 像 分 析 时 人 眼 能 分 辨 几 千 种 彩色 色调 和 强度 却 只 能 分 辨 二 十 儿 个 灰 度 级 

彩色 图 像 处 理 分 为 两 个 主要 领域 : 全 彩色 (和 ll colon 和 擅 彩 色 (pseudo-colon 处 理 . 在 第 
一 类 处 理 中 ， 待 处 理 的 图 像 是 用 全 彩色 感应 器 ， 例 如 彩色 摄影 机 以 及 彩色 扫 摘 仪 所 获取 。 在 
第 二 类 彩色 处 理 中 ， 对 于 每 一 个 色调 给 一 个 特定 的 单 色 强 度 或 强度 范围 。 直 到 最 近 以 前 ， 大 
多 数 彩 色 处 理 是 在 伪 彩 色 这 个 层次 上 进行 .1980 年 起 彩色 处 理 技术 获得 很 大 的 发 展 ， 因 为 当 
时 已 经 制造 出 彩色 感应 岂 ， 而 且 用 彩色 图 像 处 理 的 硬件 价格 也 赵 于 台 理 。 因 为 这 些 发 展 的 结 
果 ， 使 得 全 彩色 图 像 处 理 技术 获得 了 广泛 应 用 。 


S.4-1 彩色 模型 


彩色 模型 的 用 途 是 便于 以 某 种 标准 来 指定 彩色 。 事 实 上 ， 一 种 彩色 模型 是 指 规定 一 
个 三 维 坐 标 系统 和 一 个 子 空间 ， 在 此 子 空 间 内 每 种 彩色 用 一 个 点 来 表示 。 现 今 使 用 的 大 
多 数 彩 色 模 型 有 两 种 . 一 种 是 硬件 导向 的 (如 显示 器 和 打印 机 )， 另 一 种 是 应 用 导 庙 (如 动 
画 彩 色 图 形制 作 )。 实 际 中 常 使 用 且 较 为 简单 的 是 RGB ( 红 、 绿 、 蓝 ) 模型 ， 以 下 简 述 此 
模型 。 

在 RGB 模型 中 ， 每 种 颜色 是 以 它 的 红 、 绿 、 蓝 的 频谱 分 量 来 表现 。 该 模型 是 建立 
在 直角 坐标 基础 上 ， 如 图 5.4-1 所 示 ， 其 中 RGB 值 是 在 三 个 顶点 上 ; 青色 、 些 红 和 黄 在 
另外 三 个 项 点 上 ， 昧 在 原点 . 白色 在 点 (1,11) 上 ， 而 灰色 位 于 黑 到 白 之 问 的 区 绒 上 。 所 
有 的 色彩 都 在 立方 体 的 边缘 及 内 部 中 ， 它 是 由 从 原点 出 发 的 向 量 所 定义 的 。 为 了 方便 起 
见 ， 我 们 假设 所 有 彩色 的 数值 已 经 过 归 一 化 . 也 就 是 说 ， 所 有 RGB 的 值 都 在 [0, 1] 范 转 
内 。 
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(10, 所 
图 5.4-1 RGB 彩色 模型 


RGB 彩色 模型 下 的 图 像 是 由 三 个 独立 的 图 像 平 面 所 组 成 ， 每 个 原色 对 应 一 个 平面 。 当 这 
三 个 图 像 平 面 传 给 RGB 显示 器 时 ， 这 三 幅 图 像 组 合 起 来 便 成 为 一 幅 彩 色 图 像 。 所 以 当 图 像 
本 身 本 来 就 是 用 三 个 彩色 平面 所 表示 时 , 将 RGB 裤 型 用 于 图 像 处 理 是 有 意义 的 . 另 一 方面 ， 
用 于 获取 数字 图 像 的 大 多 数 彩色 摄影 机 使 用 的 是 RGB 方式 ， 所 以 RGB 彩色 模型 在 图 像 处 理 
中 是 一 个 重要 的 模型 。 

另 一 种 重要 的 彩色 模型 是 yov 模型 。 图 5.4-2 表示 RGB 彩色 模型 与 mv 彩色 模型 的 变 
摘 。 其 中 y 代表 亮度 (iumiatncej, u 为 色调 thuej，vY 则 是 饱和 度 (fsatutation) (编者 接 ; u、Y 应 
为 色差 信号 {ehrominancej)j。 RGB 彩色 模型 与 yuy 彩色 模型 之 间 的 变换 关系 可 以 用 矩阵 转换 
方式 描述 ， 如 (5.4-1) 式 所 示 。 至 于 其 他 种 类 的 模型 ， 和 后 此 之 问 也 都 可 以 任意 变换 。 


| 10.299 各 587 0.114| | 如 
天 
? 


0.596 -0275 一 0321|1|6 
0.212 -0.523 0311| | 好 

采用 yuv 模型 的 好 处 是 亮度 y 以 及 与 颜色 相关 的 uv 被 单独 分 离开 ， 因 此 许多 以 前 所 说 

的 图 像 处 理 法 ， 例 如 直方 图 图 像 增 强 法 等 都 可 以 针对 y 来 进行 而 不 会 影响 原 图 像 的 颜色 。 


{35.4-]1) 




















独 5.4-2 RGB 彩色 模型 与 yuv 彩色 模型 的 灾 接 
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S.4-2 伪 彩 色 

盆 彩 色 处 理 主要 的 葡 果 是 将 原本 灰 阶 的 图 像 ， 经 由 线 人 性 或 非 线 性 麻 换 成 彩 鱼 图像。 一 个 
典型 的 应 用 就 是 给 古老 的 黑白 图 像 上 颜色 使 其 看 来 葛 生 动 活 访 。 其 数学 定义 为 


RDI=GxTre 
GC 妨 = 纪 Te 只 (5.4-2) 
Bo 人 六 =estre 


其 中 G 、@o 、 是 线性 或 非 线 性 操作 。 如 图 5.4-3 所 示 ,， 图 中 红色 变换 、 绿 色 变 换 和 蓝 色 
变换 分 别 代 表 @ 、25 、@6 。 而 Am 原 本 是 灰 阶 图 像 ， 经 过 码 个 独立 变换 后 形成 红 、 
绿 、 蓝 个 别 分量 。 然 后 把 这 三 个 结果 单独 送 到 彩色 显示 器 的 红 、 绿 、 蓝 三 个 电子 枪 上 ,这样 
就 产生 一 幅 彩 色 合成 图 像 。 


具 (, 苛 


pm Cn 人 


五 (7, 订 ] 





5.4-3 ” 伪 彩 色 图 像 处 理 的 基本 方块 图 


5.4-3 假 彩色 


假 彩色 (false colon 也 是 一 种 彩色 图 像 处 理 的 方法 ， 它 也 是 点 对 点 变换 - 与 伪 形 色 不 同 的 
是 ， 假 彩色 处 理 的 原始 图 像 必 须 是 彩色 图 像 。 经 过 其 特殊 的 垂 阵 变换 ， 可 以 将 彩色 图 像 中 原 
本 的 颜色 加 以 变化 。 其 数学 定义 为 


及 二 如 廿 , 忆 … 
Go =@ 匠 ,…】 (3.4-3) 
Bo = 印记 , 玉 …} 
其 中 瑟 , 了 = 1,2… 代 表 不 同 的 颜色 。 与 俯 形 色 一 样 ， 吕 、2。 、 纪 是 线性 或 非 线性 操作 。 世 
许 这 样 仍然 无 法 看 出 其 运作 效果 ， 下 面 给 一 个 线 件 操作 的 形式 : (三 =R; 已 =Gi = 嫩 。 





有 足 p mi 了 到 
Co |=| ma 722 到 2 1 瘦 0.4-4) 
了 7 玉宇 
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若 和 矩阵 为 


(5.4-5) 


避 一 人 
-- 一 D) 


经 过 计算 可 得 


好 
@ = 妃 (5.4-G) 
及 


则 原本 图 像 的 变化 如 于 : 绿色 变 红色 ; 蓝 色 变 成 绿色 ; 红色 变 蓝 色 。 


由 前 例 可 知 ， 经 由 假 彩 色 处 理 ， 可 以 利用 适当 的 变换 矩阵 改变 原始 图 像 中 的 色彩 : 这 种 


技术 目前 已 广泛 被 应 用 在 制造 特殊 效果 上 。 


上 


加 


习 题 


. 你 认为 将 图 像 放 大 是 一 种 图 像 增 强 的 处 理 玛 ? 为 什么 ? 
. 以 程序 实现 了 列 丙 种 简单 的 图 像 放 大 方法 : 


(1) 霍 阶 保持 (zero-orderhold): 每 个 图 像 先 沿 行 ( 列 ) 方向 复制 一 次 ， 完 成 后 的 图 像 再 沿 
列 ( 行 ) 的 次 序 再 复制 一 次 。 
人 2) 一 阶 保持 ffirstorder hol 四 : 先 沿 行 ( 列 ) 的 方向 ， 在 两 像素 间 捕 一 个 像素 ， 其 灰 度 值 
为 前 后 两 像 素 灰 度 值 的 平均 ,完成 后 的 图 像 ， 将 上 述 程序 再 沿 列 ( 咎 ) 的 方向 做 一 次 。 
到 一 九 x 妈 的 图 像 将 其 放大 至 128 x 128 以 及 256 x 256， 并 比较 上 述 两 种 方法 的 效果 。 


.一 个 单调 递增 的 函数 是 否 适 合 一 般 图 像 振幅 调整 法 的 输 人 输出 闻 的 关系 ?为 什么 ? 
， 试 取 一 低 对 比 度 图 像 以 对 比 度 修 正法 改善 其 对 比 度 。 
. 重复 上 题 改 以 任 一 直方 图 处 理 法 进行 。 


推导 出 表 5.1-1 中 的 变换 函数 。 


.以 指定 直方 图 法 对 一 低 对 比 户 图 像 进行 图 像 增强 。 
. 证 明 中 值 泪 波 趟 是 线性 运算 。 
. 将 图 像 加 和 人间 椒 粉 式 的 脉冲 和 干扰， 再 以 3x3，5x5 及 7x7 的 中 值 滤波 器 进行 图 像 增强 


的 处 理 。 比 较 并 讨论 所 得 结果 。 


. 将 图 5.2-5 所 示 的 梯度 的 模板 运算 作用 在 一 图 像 上 ,显示 物体 边缘 的 效果 并 比较 效果 的 好 


坏 。 


. 对 一 带 胡椒 粉 式 的 干扰 的 图 像 重 复 上 题 。 比 较 这 两 题 结 果 的 差异 。 
. 设计 一 实验 ， 以 验证 5.3-1 节 所 提 到 的 振 铃 效 应 。 





图 像 降 质 系统 
代数 恢复 方法 
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图 像 恢 复 的 主要 目的 是 去 改善 一 幅 品 质 遭 受 恶 化 的 图 像 。 事 实 上 ， 复 原 是 一 种 过 程 ， 此 
种 过 程 试图 利用 对 晋 化 现象 发 生 之 前 的 了 解 ， 建 立 恶化 的 模型 ， 再 运用 相反 的 过 程 来 重建 或 
恢复 图 像 。 

早期 的 数字 图 像 恢 复 技术 大 多 是 以 频率 域 的 方法 为 基础 。 但 是 ， 本 章 则 六 代数 方法 为 探 
讨 重 点 。 这 种 方法 的 优点 是 它 能 出 相同 的 基本 原理 推导 出 许多 恢复 技术 。 昌 然 代数 方法 一 般 
包括 庞大 的 联 立方 程 组 的 处 理 ， 但 正如 以 下 诸 节 所 示 ， 在 某 些 条 件 下 ， 可 以 把 计算 复杂 度 简 
化 到 与 传统 的 频率 域 焦 复 技术 相同 的 程度 。 


6.1 图 像 降 质 系统 


6.1-1 基本 定义 


在 了 解 图 像 恢复 前 ， 要 了 解 图 像 降 质 系统 。 如 图 6.1-1 所 示 ， 假 设 输 人 原始 图 像 为 
nm] ， 经 降 质 系 统 ( 或 算 子 ) 五 作用 后 ， 再 加 入 了 吧 声 于 拢 (mm 、 得 到 输出 的 降 质 图 像 
为 Bt 人 门 ， 其 中 Mom,m 为 相 加 性 的 随机 过 程 。 如 果 不 是 相 如 性 噪声 ， 而 是 相 乘 性 的 噪声 ， 可 
以 用 对 数 变换 方式 转化 。 图 6.1-1 的 系统 可 表示 成 


8 了 二 瑟 [LAn 站] 十 了 rm 下 (6.1-1) 


Ja 由 (+ gm 用 


图 6.4-{ 图 人 条 降 质 系 统 


在 一 般 讨论 中 均 假 设 降 质 系统 瑟 是 线性 时 不 变 的 (参考 2.2 节 有 关 LSI 的 定义 ); 
(五 是 线性 的 ， 即 在 Tm,A =0 时 ， 满足 下 式 


瓦 [ 丘 及 (站 十 生 太 (= 天 王 [Am 人 + 天 五 [PC 本] (6.1-2) 


式 中 扣 和 态 为 常数 。 
. (2) 瑟 是 空间 三 中 不 变 的 。 意 思 是 说 如 果 系 统 的 输入 输出 关系 满足 gtpumj = 豆 [/oasa， 则 对 
于 任 - 个 .Am 站 和 任 一 个 常数 wx 和 有 都 有 关系 闫 [fen -am- 有 =gr-an-p)。 
在 上 述 图 像 降 质 系统 的 模型 下 ， 图 像 恢 复 的 问题 变 成 是 在 已 知 g(m, 六 ， 瑟 及 7(m 的 
情形 下 ， 对 原始 图 像 /mu 杂 做 估 测 。 此 外 ,一 个 LSI 系统 的 特性 可 完全 由 其 脉冲 响应 天 ma 站 
来 决定 ， 亦 即 对 任 一 输入 . 系统 的 输出 等 于 此 输入 与 脉 训 响 应 的 卷 积 。 


6.1-2 降 质 系统 的 和 矩 阵 描 述 
为 了 以 后 方便 描述 ， 我 们 将 降 质 系 统 以 矩阵 形式 描述 。 首 先 考虑 两 个 大 小 分 别 为 if x RN 
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局 及 和 5x 避 的 离散 二 维 信号 /mw 站 与 天 加 丰 ， 这 两 个 信和 号 的 卷 积 所 得 的 信号 g (rz, 站 的 天 
小 为 (= Mi -1x(=NHt -1 为 了 方便 矩阵 的 形成 ， 我 们 将 Fr 本 与 下 各 证 以 衬 
零 的 方式 分 别 扩 增 成 大 小 均 为 前 x 丰 的 信号 产 (ma, 四 与 下 (加 轴 ， 亦 即 


人 站 = 必 人 人 和 和 严 皖 条 , 一 1 且 0 近 下拉 让 一 ] 


0， 朵 | 过 责 所 时 一 ] 或 让 过 交 和 下 一 1 
(6.1-3) 
/ (mh 0 下 二 几 ;一 1 且 0 坟 天宝 下 ;一 1 
WormD= 习 有 ,和 击 所 时 一 ! 或 太 , 入 和 站 一 
因此 ， 
节 一 | 贞 一 1 
8 (miJ= 六 (站 RM 一 世 有 (6.1-4) 
0 了 日 
其 中 产 =0 1,2…， 扩 -1 =012N-1。 将 (6.1-4) 式 以 托 阵 方式 写成 
8=E 《6.1-5) 
其 中 
& (0,0) 三 (0.0) 
“0,1 “0 ,1 
有 = 8 ) ， 了 =- 7 ) (6.1-6) 
gd -LN-DTD 7 -1N-D1 
吾 。 豆 xw- 盏 wa 互 ， 
豆 ， 吾 。 吾 w-| 互 ， 
如 =| 殖 : 吾 ， 0 互 ; 
豆 w- 于 ，_; 吾 ， 了 吾 。 
其 中 
(00) 天 人 N 昌 
RD 0 站 
五 ,=| 天 (2) 瑚 人) 产 00) 3) (6.1-7) 
有 人 


依 类 似 的 扩展 矩阵 形成 程序 ,我们 将 噪声 mm, 六 亦 纳 人 系统 中 、 而 形成 完整 的 降 质 系统 
的 矩阵 描述 


芭 = 五 广 关 {6.1-8) 
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其 中 闫 代表 由 Tem 的 扩 增 信号 om, 人 所 形成 的 噪声 矩阵 。 

由 (6.1-7) 式 可 者 出 ， 吾 本身 为 循环 和 矩阵. 叉 由 (6.1-6) 式 可 进一步 看 出 音 为 方块 循环 
和 官 阵 。 从 实用 的 角度 来 看 ， 和 矩阵 站 的 小 大 为 WMNxHMN， 因 此 若 灯 = 闪 =512， 则 志 的 大 小 
为 262 144 x 262 144， 这 对 一 般 电脑 而 言 要 直 究 从 (6.1-8) 式 计算 出 了 并 不 实际 。 所 幸 ， 由 
于 豆 是 循环 矩阵 ， 我 们 可 证 明 ( 留 做 习题 ) 


” 瑟 = FJ- 或 画 = 丙 -五 椒 《6.1.9) 


其 中 于 为 豆 的 特征 向 量 所 构成 的 矩阵 ,， 刀 则 为 吾 的 特征 值 所 构成 的 对 角 乍 阵 。 此 外 ,了 琴 的 
元 素 基本 上 是 离散 傅立叶 变换 的 变换 基底 ， 而 她 的 元 素 则 为 j(m, 六 的 离散 傅立叶 变换 


百 优 站。 
设 GGE 为 伏 兴 的 傅立叶 变换 ， 即 
GD 门 = 记 写 stn om- 的 二 和 ] (6.1-10) 
则 我 们 可 证 明 到 - 妊 相 当 于 
G(0.0) 
CCJ) (6.1-11) 
GQA _LN -1 


亦 即 不 ”相当 于 一 算 子 ,对 后 面 运算 所 得 的 效果 就 是 取 其 傅立叶 变换 ， 并 将 其 系数 扒 重 成 矩 
阵 。 结 合 (6.1-8) 与 (6.1-9 式 我 们 可 得 


不 - 基 = 玫 机 -+ 一 玉 (6.1-12) 
转 成 相对 应 的 离散 傅立叶 变换 ， 每 个 元 索 之 间 有 如 下 关系 
G( 天 站 = 甩 ( 天 站) 开 ( 天 PHN( 门 (6.1.13) 


其 中 上 = 012…, 打 -1; 1=0.12…,N-1。 

(6.1-12) 式 所 供 一 个 解 (6.1-8) 式 的 另 一 个 好 方法 ， 即 进行 几 个 Mx 的 离散 傅立叶 变换 
就 好 ， 而 不 需要 考 央 MNV xJN 矩阵 的 计算 问题 。 此 外 ,， 若 好 与 浆 为 2 的 乘 寡 ， 则 有 很 放 现 
成 的 快速 傅立叶 许 算 法 可 进一步 和 降低 求 离散 傅立叶 变换 的 计算 重 。 


6.2 ”代数 恢复 方法 


代数 法 的 主要 概念 是 在 寻找 一 个 了 的 估计 广 , 使 得 事先 定义 的 性 能 准则 最 小 化 。 此 处 将 
采用 简单 的 最 小 平方 准则 函数 。 做 此 选择 的 主要 优点 是 对 于 推导 出 若干 裔 知 的 恢复 法 提供 一 
个 统一 的 结构 。 这 些 恢复 法 可 分 为 有 条 件 限制 性 及 无 条 件 限 制 性 两 类 。 
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6.2-1 无 条 件 限 制 性 恢复 


由 (6.1-8) 式 可 知 ， 降 质 模型 中 的 噪声 项 为 
站 = 入 一 再 太 {6.2-]) 


此 处 m、 及, 扩 吾 均 为 矩阵 向 量 形 式 ， 其 维度 分 别 为 MNxi，MNx1，Nx1 与 MNxaN 。 

当 缺 乏 对 于 m 的 任何 了 解 时 ， 一 个 有 意义 的 准 别 丕 数 是 寻找 这 样 一 个 让 ， 让 所 假定 吕 声 
项 的 范 数 尽 可 能 地 小 ,使 得 吾 产 在 最 小 平方 意义 下 近似 于 有 。 换言之 ， 我 们 想 寻 找 一 个 了 ， 
使 得 


只 =- 起 | (6.2-3) 
为 最 小 。 上 式 中 ,按照 定义 

人 = 和 |e- 环 | = 人 8- 本 关公 - 研 ) (6.2-3) 
分 别 为 半 和 (一至 7 的 范 数 的 平方 。 由 (6.2-2) 式 可 知 此 一 问题 相当 于 准则 函数 

JP)=e- 村 | (6.2-4) 


对 于 六 的 最 小 化 问题 。 除 了 要 求 它 使 (6.2-4) 式 为 最 小 外 ， 没 有 任何 其 他 条 件 的 限制 。 
使 (6.2-4) 式 为 最 小 很 容易 办 到 ， 亦 即 只 要 将 了 对 地 微分 ， 并 今 其 结果 等 于 零 向 量 即 得 


ar( 方 - 。 
一 -~ 一 站 = 一 2 再 一 瑞 厂 .2 -号 
5 人 一 五 (6.2-3) 
对 了 求解 (6.2-3) 式 ， 得 出 
天 =( 百 I 媚 ) -再 7 到 (6.2-6) 


假设 豆 存在 ， 则 (6.2-6) 式 简 化 为 


六 = 百 -( 囊 IT 1 百 I8= 古 -8 (6.2- 刀 
6.2-2 ”有 条 件 限 制 性 恢复 


在 本 节 里 , 我 们 把 最 小 平方 恢复 问题 看 做 是 在 条 件 | 中 = je - 下 | 的 限制 下 . 范 数 忆 州 


所 构成 的 函数 的 最 小 化 问题 ， 其 中 多 是 作用 于 地 的 一 个 线性 算 子 。 这 种 方法 使 恢复 过 程 相当 
复杂 ,因为 对 于 允 的 不 同 选择 会 得 到 不 同 的 解 。 
在 最 小 化 问题 中 ， 对 计 一 个 等 式 条 件 跟 制 的 加 入 ， 可 以 利用 第 二 前 中 所 提 到 的 拉 格 半日 
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科 数 法 加 以 处 理 。 其 步 踊 是 把 条 件 限制 表示 成 | 一 不 | - 





的 形式 ， 然 后 把 它 如 到 避 
数 |@ 判 上 。 换言之 . 我 们 寻找 一 个 户 ， 使 得 准则 函数 


7, 记 = 他 并 ol- 本 -出 (62. 


为 最 小 。 式 中 必 是 一 个 常数 ， 称 为 拉 格 朗 日 乘 数 。 一 旦 加 上 条 件 限 制 之 后 ， 最 小 化 问题 就 可 
以 用 通常 的 方法 来 求解 。 
将 (6.2-8) 式 对 六 徽 分 并 令 其 结果 等 于 零 向 量 ， 得 出 


六- =-0=201I07 -2aHTC- 研 ) (62-9) 
对 (6.2- 多 式 求解 疡 ， 即 得 

六 =( 囊 7 下 +7 人 7 全 古 78 (6.2-10) 
其 中 7y7= le : 这 个 等 式 必 须 调整 到 满足 本 问题 的 条 件 限 制 。 
6.3 友 滤 波 法 


我 们 用 (66.2- 六 式 的 无 条 件 限 制 结 果 开 始 推导 图 像 恢 复 技术 : 利用 (6.1-9) 式 将 (6.2-7) 式 
改写 成 


天 = 万 -= (了 本 万 到 1 有 = 卫 历 - 歼 - (6.3-1) 


式 中 于 为 下 的 特征 向 量 所 构成 的 矩阵 . 妨 为 玖 的 特征 值 所 构成 的 对 角 些 阵 。 
将 (6.3-1) 式 的 两 边 苇 以 不 ， 得 到 


厂 下 六 = 及- 厂 -g (6.3-2] 
利用 6.1-2 节 的 结果 ， 我 们 将 组 成 (6.3-2)} 式 的 元 素 写 成 下 面 形式 
GE 
下 (六 = 和 {6.3-3】 


其 中 丰 =012paM-1; =012, Ni 

(6.3-3) 式 所 表示 的 图 像 恢 复 法 通常 称 为 反 滤 波 器 (inverse flter) 法 。 这 个 术语 的 由 来 是 把 
五 估 门 看 做 一 个 “滤波 器 "函数 ， 它 乘 上 户 大 站 便 会 产生 退化 图 像 g(m 辣 的 傅立叶 变换 。 在 
(6.3-3) 式 中 ，G(E 门 除 以 五 全力 形成 了 反 滤 波 作 用 。 当 然 , 恢复 图 像 是 利用 下 面 的 关系 式 得 
到 的 


第 六 章 ”图 像 焦 复 -123- 


AmmD=2- 攻 knFy GDyaD] (63-4) 


其 中 严 =012… -1 0=012 -1。(6.3-4 式 可 用 FFT 算法 来 实现 . 

值得 注意 的 是 在 (6.3-4) 式 中 , 如 果 乒 (站 在 站 平面 上 的 任意 区 域内 为 零 或 变 得 非常 小 . 
那么 在 恢复 过 程 中 就 会 遇 到 计算 上 的 困难 。 如 果 互 全 站 的 零点 位 于 如 平面 的 少数 儿 个 点 上 ， 
则 在 计算 忆 ( 拓 站 时 一 般 可 以 和 忽略， 而 对 恢复 结果 不 会 有 明显 的 影响 。 


6.4 最 小 平方 沽 波 般 


在 最 小 平方 滤波 器 图 像 恢 复 法 的 推导 过 程 中 ， 我 们 首先 定义 灵 , 为 了 的 相关 矩阵 ， 亦 即 
BRr = EU {6.4-) 


式 中 互 表示 代数 期 望 值 运算 。 妨 ,的 第 列 与 第 / 行 的 元 素 用 Bf 太太 } 表示 ， 它 是 了 的 第 ! 个 
和 第 / 个 元 素 之 间 的 关系 。 因 为 了 的 元 素 为 实数 ， 所 以 


也 二 王 攻 三 方 } 一 下 方太 】} 三 站 (60,4-2) 


假设 任意 两 像素 的 相关 性 只 与 像素 间 的 距离 有 关 , 而 与 它们 所 在 的 位 置 无 关 , 则 如 / 可 用 
方块 循环 矩阵 有 来 表示 


肝 。 是 w-i 妃 
亚 | 及， 上 且 : 
亚 =|j| 于 四 {5.4-3) 
轴 ， 上 且 2 如 。 
其 中 
六 中 璇 1 五 41 _ 
| 六 0 六 : 
时 | =| 六 > 五 1 0 (6.4-4) 
六 w-] 乒 mr- 万 0 了 





因而 由 6.1-2 节 的 讨论 可 知 ， 我 们 可 利用 灵 的 特征 向 量 组 成 一 个 到 和 插 阵 对 它们 进行 对 角 化 
到 = 及; 名 于 二 {fww 避 有 丰 儿 台 fw 天) 


_ | | 本 | [6.4-5) 


式 中 必 n=012 有 -1 且 交 = 六-T， 则 股 ; = 阮 4 玉 -， 其 中 对 角 和 矩阵 4 中 的 元 
素 为 相关 矩阵 / 中 诸 元 索 的 傅立叶 变换 。 接 着 ， 我 们 定义 严 , 为 # 的 相关 和 矩阵 ， 亦 即 
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电 三 玖 人 (6.4-6) 


则 同 理 可 得 及 ,= 3B 浅 -! ， 其 中 对 角 和 矩阵 了 3 的 元 素 为 相关 矩阵 刺 中 雍 元 素 的 傅立叶 变换 。 
我 们 用 Sy (5D 和 3,(DD 表 示 4 和 了 矩阵 中 各 元 素 。 因 为 六 和 妨 , 中 的 各 元 素 是 三 和 了 

各 元 素 之 间 的 相关 函数 ， 因 此 3， ( 术 0D 和 3, (此 站 分 别 为 (oo 中 和 7 (me 四 的 功率 谱 密度 。 
我 们 选择 线性 算 子 妈 满足 以 下 关系 


骆 人 = 只 一 六 [6.4- 力 
代 人 (2-10) 式 得 
六 = (可 7 吾 +7 忆 天 .) 再 了 8 (6.4-9) 


利用 (6.19) 式 及 吕 | = 有 4 汪 一 及 玉 , =PB 卫 -的 结果 可 得 


天 = ( 卫 玉 用 取 - +7 汪 全 下 本 下 至 太 "到 g (6.4-9) 
两 边 共 乘 政 “， 化 简 后 可 得 
一 郑 =( 且 万 +7 4 太 ' 了 -8 (5.4-10) 


可 以 看 出 括号 内 的 矩阵 是 对 角 垂 阵 。 利 用 6.1-2 节 所 发 展 出 的 观念 可 将 (6.4-10) 式 中 的 元 素 写 
成 下 列 形 式 


RD= 本 
五 有 十 8 ( 估 站 713 (1 





Gin (6.4-11 


式 中 上 = 012…M -1 =012…N-1 7y=1a， 
由 上 式 可 推出 用 个 特别 情况 : 
(T 当 y=1 时 . 式 中 较 大 括号 内 的 项 即 为 Wiener 滤波 器 .。 若 7 为 可 变 则 称 为 参数 WWiener 
滤波 器 。 
(2) 在 无 噪声 存在 ， 即 9 收 六 =0 时 、 则 变 成 


EDD=[IU EDIGGD) (6.4-12) 


这 就 是 6.3 节 的 反 滤 波 器 。 

G) 如 果 SF 站 和 3 (站 为 未 知 时 (这 是 实际 上 常 碰 到 的 状况 ]， 则 (6.4-11) 式 可 表示 为 
1 本 中 

五 (6DD | 瑟 吃 同 + 丰 





天 (天 ,站 -| es 人 (6.4-13) 


式 中 乓 是 嗓 声 对 讯号 的 谱 密 度 之 比 ， 它 近似 为 一 常数 。 此 式 可 以 使 退化 图 僚 得 到 -- 
定 积 度 的 恢复 ， 但 未 必 是 最 佳 恢 复 。 
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6.3 ”限制 性 最 小 平方 恢复 


在 上 一 节 所 列 的 最 小 平方 法 是 一 统计 方法 ， 因 为 其 最 佳 化 的 准则 是 以 图 像 和 噪声 函数 的 
相关 矩阵 为 基础 。 也 就 是 说 ， 用 Wiener 淡 波 器 得 到 的 结果 在 平均 意义 上 是 最 佳 的 。 但 此 处 所 
研究 的 方法 对 每 一 幅 所 给 的 图 像 都 是 最 佳 的 ， 并 且 只 需要 知道 噪声 的 平均 值 和 方差 。 

我 们 先 考虑 一 维 情况 : 对 于 一 个 离散 画 数 Fa) ，mm=0,12…， 在 点 六 上 的 二 阶 导数 可 以 
近似 地 表示 成 如 下 形式 

3 rm+D-2rooD+yron-D {6.5-]) 


Dr 


故 以 该 式 为 基础 的 准则 是 使 (9" 广 /9z 六 在 出 上 最 小 ， 亦 即 


minimjize |Zvosrp-zym+ym -中 | {6.5-2) 
或 者 用 齿 阵 符号 表示 为 
minimize{ FrCrCGr} (6.5-3) 
其 中 
1 
-2 1 
1 -2 1 
1 -2 1 
C= . (6.5-4) 


是 一 “平滑 ” 齿 阵 , 了 是 .Am 的 取样 值 所 形成 的 一 个 向 量 。 
在 二 维 状况 下 ， 我 们 考虑 (5.5-1) 式 的 直接 推广 。 在 此 情况 下 ， 准 则 为 


了 2 “ 
aininizo| 3 了 + 二 ?| (6253) 


其 中 导 枯 数 是 用 下 式 来 近似 
3 327 


十 
Dzrz” 日 








= [2 个 一 Or+1D 有 一 天 m 一 可 ] 


十 [之 站 mm 站 一 (十 划一 Fe 一 了 
盖 寻 站 一 [7 关 二 1 本 十 站 交 一 1 站 
十 Cn 天 二 二 十 -ro 一 暮 ] 《6.5- 合 
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上 式 可 以 直接 用 计算 机 来 实现 。 但是， 利用 Fr, 阅 和 下 面 的 算 子 P(mm) 的 卷 积 亦 可 以 完成 
同样 的 运算 


0 -1 0 
pim=| -1 4 -1 (6.5-7) 
0 -1 0 








浊 外 使 用 扩 增 的 产 (m, 四 和 Pa 人 可 以 避免 离散 卷 积 过 程 中 的 重 倒 误差 .我们 以 如 下 的 方式 
构成 Pa 


PN，0S 弄 科 2 上 且 0 扫 天 反 2 


厂 .-8 
已 3 到 几 所 财 一 1 或 3 过 和 六 一 1 人 ) 


P(m 站 = | 


如 果 Am 丰 的 大 小 为 4x 召 ， 则 我 们 选择 好 六 4+3-1 和 不 关 妨 +3-1， 因 为 pm, 相 的 天 小 
为 了 3X3 : 


于 是 扩 增 函数 的 科 积 为 
rm 加 = 妆 人 OP rn (6.5.9) 
我 们 在 比 将 平滑 准则 表示 为 矩阵 形式 、 首 先 我 们 建立 一 个 如 下 形式 的 方块 循环 矩阵 
CC ceC 
C= 4。 Co 四 4 (6.5-10) 
cc ec ec 
式 中 每 个 子 窍 阵 C 是 一 个 XxN 循环 矩阵 ， 它 是 由 PCm, 站 的 第 / 行 所 构成 的 。 即 
PUO PPUN-D … 了 7FD 
c - Pi FU) 2 2) (65.1) 
PN-D PN pg 
因为 5 为 方块 循环 矩阵 ， 故 可 用 6.1 节 中 所 定义 的 矩阵 于 进 行 对 角 化 。 亦 即 ， 
巨 = 歼 -CR (6.5-12) 
式 中 召 是 -一 个 对 角 和 矩阵 ， 它 的 元 素 为 
(做 站 = 中 和 mod ] 如 蛇 7 = (6.5-13) 
如 果 z 大 





其 中 PT 是 疡 (mm 站 的 二 维 傅立叶 变换 科 以 因子 MNV-。 
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上 述 眷 积 运算 与 实现 (6.5-6) 式 旦 等 获 的 ， 所 以 (6.5-8 式 的 平滑 准则 取 和 (6.5-3) 式 相 同 
的 形式 
minimize{f PCTC7} [6.5-14) 


式 中 了 是 一 个 MN 维 向 量 ，C 的 大 小 为 MNxMN 。 若 令 人 = C. 并 利用 |o 下 = @P@ 让 
= 772787 ， 则 这 个 准则 可 以 表示 为 


minimize 愉 /| (6.5-15) 


事实 上 ， 如 果 我 们 要 求 满足 限制 条 件 |e - 到 | = 人 ， 则 66.2-10) 式 在 双 = C 时 得 出 最 佳 解 


六 = (再 I 吾 +NCTC] 7 [6.5-16) 
利用 与 前 一 节 所 还 的 相同 方法 ， 上 式 成 为 
闻 = ( 邯 有 1 太 卫 并 +7 卫 厂 ' 吾 卫 下 和 再 玉 ' 卫 -8 《6.5-17) 


两 边 都 乘 以 政 ”并 进行 一 些 矩阵 变换 ， 上 式 简化 为 
卫 站 六 = (p? 太 +7' 玉 三 万 ' 柬 -8 (6.5.19) 


利用 对 角 化 对 降 质 模型 影响 的 概念 ，(6.5-18) 式 可 表示 成 


到 | | 《6.5-19) 


FID=| 一 一 一 一 一 
| 豆 寻 有 + 








其 中 局 =012N-1， 人 加 (8 有 = 五 (后 站 五 对 六 ,并 县 已 假设 W= NM。 注意 到 (6.5-19) 式 与 
6.4 节 讨论 的 参数 Wiener 滤波 器 类 似 。(6.4-11) 式 与 (6.5-19) 式 之 间 最 主要 的 区 别 是 后 者 要 佑 
计 蝇 声 平均 值 和 方差 而 不 要 求 确切 知道 其 他 统计 参数 (6.2-10) 式 所 列 的 一 般 公式 要 求 调整 7 





使 得 限制 条 件 卜 - 王 二 = 加 得 以 满足 ， 同 理 (6.5-19) 式 所 给 的 解 也 只 有 当 y 满足 这 一 条 件 
时 才 是 最 佳 的 。 要 估算 此 一 参数 ， 有 一 个 可 用 的 从 代 程 序 如 下 所 述 。 
首先 定义 残余 向 最为 
r=8- 下 (6.5-20) 
用 (6.5-16) 式 代 蔡 广 ， 得 到 
一 生 一 再 (如 " 吾 +yC CO 再 7 (6.5-21) 


{6.5-21) 式 指出 ，r 是 的 一 个 函数 ， 可 以 证 明 


此 2=rr=|| (6.5-22) 
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是 y 的 - -个 单调 递增 函数 。 我 们 油 整 7 使 得 
所 = 全 = (6.5-23) 


其 中 = 是 一 个 准确 度 因 子 。 可 以 很 清楚 地 看 出 ， 如 果 | 中 = 四  ， 则 从 (6.5-20) 式 来 看 ， 将 完 
全 得 到 满足 限制 条 件 把 - | = 

因为 凡 7) 是 单调 的 ， 找 到 一 个 满足 (6.5-23) 式 的 了 并 不 国难 。 一 个 简单 的 方法 是 ; 

C) 计算 六 和 加 。 

G) 如 果 (6.5-23) 式 满 足 则 停 正 ; 否则 ， 如 果 作 | < 避 -< ， 则 在 增加 7 之 后 返回 (2)， 

如 果 | 虽 > +s ， 则 在 既 低 7 之 后 返回 O]。 

其 他 方法 ， 如 Newton-Raphson 算法 . 可 以 用 来 改善 收 伍 速度 。 

上 述 概念 的 实现 必须 对 | 有些 了 解 。7r(m, 中 的 方差 为 


a3 - 可 | yo- 玖 上 形 (0 站 生效 (6.5-24) 
其 中 


于 


一 j ， 
六 = 矶 TV 之 之 9 (pp 器 (6.5-25) 


是 r(m 有 的 平均 值 。 如 果 用 玛 样 平均 来 近似 六 (说 的 期 望 值 ， 则 (6.5-24) 式 变 为 


| 


1 7 四 
om = TCWCD 之 9 (mm 一 下 (6.5.26) 


总 和 项 表示 把 阵列 六 (mm, 丰 中 所 有 的 疡 =012 1- 和 着 = 和 012 六 -1 的 项 进行 平方 相 
加 。 这 种 运算 就 是 简单 的 咪 m 积 ， 根 据 定义 它 等 于 必 。 质 以 (6.5-26) 式 化 简 为 
2 一 可 -入 (6.5-27] 
”人 UM-D-DT 
或 
必 =Gx-Dw- cr: + ] (6.5-28} 


此 式 显示 我 们 能 利用 噪声 平均 值 和 方差 来 确定 限制 值 ， 而 如 果 这 些 量 是 未 知 的， 我 们 也 可 以 
实际 估 测 出 来 。 

限制 最 小 平方 恢复 法 可 以 总 结 如 下 : 

人) 选择 7 的 ~ 个 初始 值 、 并 利用 (6.5-28) 式 得 到 内 的 一 个 估计 . 

人 @) 利用 (6.5-19) 式 计算 记 大 站 。 取 户 (k, 六 的 傅立叶 反 变 换 得 到 疡 。 
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G) 根据 (6.5-20) 式 形成 残余 向 量 "， 并 计算 6)=| 。 
(4) 增加 或 减少 7 。 
mD 4)<I 思 -= ,根据 上 面 给 出 的 算法 或 其 他 近似 方法 (Newton-Raphson 法 ) 增加 


< 
@@ gj)> 网 +s ， 根 据 一 个 适当 算法 减 小 。 
(5) 返回 (人 2) 并 按 顺 序 继 续 于 去 ， 一 直到 (6 为 真 。 
(9 4 加 二 ， 这 里 se 决定 限制 条 件 满足 的 精确 度 。 停 止 估 测 过 程 。 对 这 时 的 y 求 得 


的 产 便 是 恢复 后 的 图 像 。 
6.6 育 吓 图像 恢 复 技 术 
6.6-] 简 介 


假设 一 个 受 污 染 的 图 像 gen,z) 可 用 原始 图 像 Am, 由 与 点 扩 范 才 (Point-spread fanction， 
PSP) Am 站 的 卷 积 表示 如 下 


ECam)= onjsRnm 【6.6-]) 


传统 的 线性 图 像 恢 复 技 术 都 是 假设 PSF， 即 Ar,) 是 已 知 的 ， 但 在 很 多 的 实际 情形 中 却 不 
是 如 此 。 换 言 之 ， 我 们 对 Am 四 是 “盲目 的 (blind)j"。 这 时 ， 原 始 豆 像 Fn, 站 必需 直接 借助 
gr 中 来 估 测 。 这 种 情形 通常 出 现在 事前 图 像 信 息 取得 有 困难 时 ， 很 可 能 是 因为 危险 、 花 
费 庞 大 ， 或 是 根本 无 法 本 得 。 例 如 : 首次 拍摄 的 怕 测 图 像 或 天 文 图 像 ， 其 通道 污染 的 过 程 
难以 即时 得 知 ; 又 如 在 诸多 医学 电视 会 议 等 应 用 的 即时 图 像 处 理 上 ， 必 须根 据 受 污染 的 连 
续 图 像 在 线 (on-line) 估 测 其 污染 ; 还 有 在 太空 探险 的 任务 上 ， 可 能 因 体 积 及 重量 等 限制 ， 
被 扎 只 能 使 用 较 低 解析 度 的 摄影 机 而 获得 有 待 图 像 恢复 的 较 差 图 像 ， 另 外 在 X 光 取 像 上 ， 
增强 X 光 的 强度 可 提高 图 像 品 质 ， 但 可 能 对 病人 的 健康 有 害 ， 因 而 只 能 获得 并 不 是 太 理想 
的 图 像 。 

典型 的 盲目 图 像 恢 复方 块 图 如 图 6.6-1 所 示 。 原 始 图 像 Am 四 经 过 恶化 模型 Ar 站) 后， 
我 们 必须 通过 各 种 统计 信息 或 物理 特性 来 估 测 PSF 。 最 后 ， 经 过 盲目 恢复 的 算法 估 测 出 
jw 站 。 我 们 的 最 终 目 的 当然 是 要 使 估 测 的 图 像 Ar,a) 趋 近 于 原始 的 图 像 Am,m]- 

这 - 节 主 要 是 介绍 五 种 盲目 图 像 恢 复 技术 : 

人 堆 表 面 分 离 (zero sheet separatiom)- 

包 ) 先 验 模 糊 辨 认 法 但 priori blur identification methods)。 

岛 ARMA 参数 估 测 法 。 

地 非 参 数 式 定型 图 像 限 制 恢复 技术 。 

二 以 商 阶 统计 (hipgh order statistics) 为 基础 的 非 参数 法 . 
并 分 析 其 适用 范围 、 收 敏 性 及 复杂 度 等 问题 。 
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真实 图 像 全 用 


降 质 图 像 


有 关 真 实 图 像 与 
PSEF 的 部 分 信息 





图 6.6-1 言 肯 图 像 恢 复 


6.6-2 方 法 


@ 霍 表 而 分 离 


在 多 维 > 变换 中 有 一 个 性 质 是 说 ， 一 个 大 维 序 列 的 z 变换 的 零点 几乎 都 是 连续 ， 市 昌 落 
在 (2-2 维 的 一 个 超 曲 面 hypersurface) 上 。 假 设 有 > 个 多 维 序 列 搬 记 …, 天 的 着 积 ， 即 


和 六 六 《6.6-2 


则 其 = 变换 为 
硬 X 到 X…X 本 (6.6-) 
如 果 能 将 各 五 的 等 点 所 座 落 的 超 曲面 分 离 ， 便 可 得 各 个 中 ， 其 中 e 为 一 比例 因子 。 这 就 是 零 
表面 分 离 的 概念 。 
在 不 考 虚 相 如 性 噪声 的 情况 下 ， 就 二 维 图 像 恢 复 的 问题 前 音 , 大 =>=2， 即 


8 二 7 有 宇 大 Hi 放 ) (6.6-4) 
其 z 变换 为 
Cl 2 = 3] 22) (6.6-5) 
由 此 可 知 多 项 式 Ge 2 是 可 分 解 的 因此 , 区 像 盲 目 恢 复 的 问题 相当 于 对 二 维 多 项 式 Clzi, za) 
的 因 式 分 解 问题 。 厕 后 者 的 问题 有 电脑 可 执行 的 算法 来 计算 ， 不 过 相当 繁琐 . 
零 表面 分 离 技术 最 有 用 之 处 是 提供 了 酒 察 盲目 恢复 问题 的 能 力 ， 它 可 处 理 三 维 或 更 高 维 


芍 问 题 : 但 其 缺点 是 对 噪声 相当 繁 感 ， 计 算 量 也 非常 大 。 所以， 这 种 方法 在 实现 上 有 困难 之 
处 、 


@ 先 验 模糊 辨识 法 


这 种 方法 最 大 的 特色 ， 也 是 其 限制 ， 是 在 做 图 像 盲目 恢复 前 ， 要 先 试图 把 PSF 找 出 来 . 
这 种 方法 都 对 PSF 有 基 些 假设 、 或 是 已 知 其 参数 异型， 例如: 照相 机 水 平 抠 动 及 焦距 模 精 所 
形成 的 PSF . 
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有 一 种 常用 的 先 验 模 糊 辩 识 法 称 频 域 零点 法 ， 其 概念 如 下 。 对 (6.6-1) 式 取 傅立叶 变换 得 
G( 全 站 = 无 格 门 页 开门 (6.6-6) 


假设 PSF 有 一 个 已 知 的 参数 形式 ， 而 且 只 要 给 出 其 频 域 堆 点 ( 即 妃 号 1) 的 零点 )， 就 可 找 出 
对 应 的 唯一 参数 值 。 实 际 上 常 碰 到 的 PSF 可 完全 由 其 频 域 零点 反应 出 来 : 
(1 长 度 24 的 照相 机 水 平移 动 模糊 


旭 ， 严 关 章 一 外 女 阳 殷 扣 
ADD=11 0 yn [6.6-7) 
2d ， 
此 类 PSF 的 频 域 零 点 落 在 与 模糊 方向 直线 上 相 既 14 处 。 


C) 有 贺 形 孔隙 的 未 对 焦 镜 片 系统 


0 2 二 12 > 
人 丰 .6-8 
二 7， Vi 十 了 裤 ) 
下 


所 对 应 的 频 域 零点 落 在 以 原点 为 中 心 且 在 > 上 近乎 周期 的 同心 加 上 。 

已 知 @ 优 门 的 零点 以 及 PSF 的 参数 形式 ， 盲 目 恢复 的 问题 变 成 区 别 忆 优 站 的 零点 与 
娓 做 门 的 零点 的 问题 。 有 一 个 稚 点 分 离 程序 可 用 来 解决 此 问题 : 一 旦 找到 万 估 万 的 零点 ， 就 
可 佑 测 PSF 的 参数 值 (如 果 PSF 是 江 自 于 照相 机 移动 或 不 对 焦 的 话 ， 此 即 (6.6-7) 式 的 4 或 
(6.6-8) 式 的 门 。 在 获得 PSF 的 佑 测 后 ， 就 可 使 用 传统 的 图 像 炭 复 法 来 估 测 出 原始 图 像 、 

上 述 方法 并 未 考虑 相 加 性 噪声 存在 时 的 情况 ， 此 噪声 通常 会 使 @ 优 门 的 零点 变 得 不 明 
显 ， 因 此 本 方法 比较 适合 于 高 信 品 比 的 图 像 。 本 方法 是 普遍 来 用 成 功 的 一 种 方法 ， 主 要 原因 
是 其 计算 简单 而 且 很 可 靠 (不 会 有 其 他 方法 因 进 代 无 法 收敛 的 状况 发 生 )。 其 主要 限制 是 必须 
知道 PSF 的 参数 形式 。 此 外 , 在 和 光 或 天 文 图 像 的 恢复 问题 上 ， 因 为 其 PSF 通常 是 高 斯 的 形 
式 ， 使 得 豆 上 0 的 频 域 零 点 不 存在 ， 此 时 就 得 用 其 他 方式 了 。 


名 上 RMA 参数 估 测 法 


ARMA 参数 估 测 方法 是 把 原始 图 像 模 式 化 成 自 可 归 (autoregressive, AR) 过 程 , 把 PSF 模 
式 化 成 移动 平均 (moving avetage，MA) 过 程 ， 模 糊 图 像 就 表示 成 自 回归 移动 平均 
(autoregressive moving average, ARMA) 过 程 。 原 始 图 像 Ar,m) 在 AR 模式 里 表示 成 


天 (到 , 严 ) 一 





nm= a 优 ,有 -天 让- 门 +nn] (6.6-9) 
好 人 


其 中 四 , 朴 是 模式 化 过 程 的 错误 ，z 估 ,人 门 是 AR 模式 的 系数 ， 玉 是 做 站 的 范围 。 
如 以 矩阵 一 向 量 表示 可 写成 


了 = Er+ 有 (6.6-10) 
降 质 图 像 g(m,m) 在 ARMA 模式 里 表示 成 
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吓 Co 人 = 和 ADJ 人 -e+9O (6.6-11) 
性 J 丰 吕 
其 中 Te 林 是 可 加 性 曲 声 ， 心 是 化 六 的 范围 。 如 以 矩阵 一 向 量 表示 可 罕 成 
叱 = 吾 F 关 (6.6-12) 
将 (6.6-10) 式 代 人 (6.6-12) 式 得 
8 = 五 CT -和 iv (6.6-13) 


其 中 了 工 为 单位 矩阵 。 整 个 ARMA 模式 化 过 程 的 方块 图 如 图 6.6-2 所 示 ， 其 中 大 写字 母 代 表 其 
小 写字 坪 的 = 变换， 
相 加 性 噪声 
形 几 ,站 


刀 出 ,让 
一 二 一 上 | 万 Ga 洁 
高 斯 白 曲 声 | “422) | 真实 图 像 降 质 图 像 


AR 视 趟 MA 模式 Sm 
后 6.6-2 ”六 RMA 模式 化 方块 图 


整个 盲目 恢复 的 问题 现在 变 成 从 g(zz) 中 要 俩 测 出 a 开 站 E 玉碎 及 有 本 门 ,开门 ER 
一 且 j# 门 决定 后 ， 传 统 的 线性 图 像 恢 复 法 就 可 用 来 估 测 原 图 像 。 

实际 上 用 (6.6-13) 式 估 测 alp 1 与 Mk 站 的 困难 包括 高 计算 复杂 度 (PSF 占 较 大 范围 时 )， 
佑 测算 法 的 不 稳定 性 以 及 非 惟一 解 等 问题 。 因 此 也 不 是 所 有 形式 的 PSF 都 适合 用 本 方法 ,但 
像 (6.6-77 及 (6.6-8) 式 的 PSF 则 没有 问题 。 

ARMA 模式 在 二 阶 统 计 特性 下 有 两 种 较 常用 的 方法 : 

@D 色 大 可 能 (maximum-likelihood, MIL) 法 

他 广义 交叉 确认 (generalized cross-validation, GCV) 法 

ML 法 试图 从 g (ma, 站 中 估 测 出 下 列 参 数 


日 一 信人 D{e( 本 六 oo 《6.6-14 


其 中 加 与 Gy 分 别 为 了 mm 与 we 站 的 方差 。 我 们 要 的 -一 个 参数 佑 测 全 是 使 接收 到 所 观察 而 
得 图 像 的 机 会 或 可 能 性 (likelihood) 最 大 者 ， 可 写成 


9 =argfmax LO =argfmaxlog Pi9)} (6.6-15) 


其 中 Z6) 代 表 6 的 log-likelibood 函数 ，@ 代表 8 内 各 元 素 的 范围 , 而 ptg:g 则 是 已 知 6 时 的 
概率 密度 函 赦 。 

在 ?与 ” 均 假 设 为 等 平均 高 斯 过 程 的 情况 下 ， 可 得 到 一 个 恰当 的 p(g;6) 。(6.6-15) 式 的 
问题 形成 一 种 非 线性 最 优化 的 问题 ， 目 前 存在 有 许多 方法 ， 鲍 如 梯度 为 基础 的 方法 期望值 
为 最 大 值 的 技术 、 估 测 误 差 为 基础 的 方法 ， 以 及 最 小 平方 法 等 。 

GCY 法 是 在 数据 分 析 上 常 采 用 的 方法 ， 其 原理 简 述 如 下 。 首 先 数据 分 成 二 组 。- 组 为 估 
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测 集 ， 另 一 组 为 验证 (validation) 集 。 估 测 集 是 用 来 估 测 模型 的 参数 值 或 某 种 假设 ， 验 证 集 则 
是 验证 这 些 估 测 或 假设 的 表现 情形 。 为 了 要 更 充分 利用 现 有 的 数据 ，GCYV 便 所 有 数据 都 可 扮 
演 佑 测 与 验证 的 角色 。 

其 做 法 是 将 数据 分 成 内 组 . 除了 其 中 一 组 外 ， 其 他 数据 都 用 来 验证 某 个 参数 或 假设 ， 记 
录 对 此 组 的 验证 误差 。 技 着 挑 另 一 组 ， 重 复 上 述 操作 自 到 每 一 组 邦 轮 完 为 止 ， 将 各 组 的 验证 
误差 取 平 均 就 是 对 某 个 参数 或 假设 的 理 体 验证 误差 。 

现在 将 GCYV 法 用 在 图 像 恢复 上 . 首先 将 降 质 图 像 的 数据 分 成 Wg 组 , 其 中 Weg 代表 图 
像 g 的 像素 个 数 。 除 一 个 像素 外 ， 其 他 像素 都 用 来 做 图 像 恢 复 (例如 以 ML 法 佑 测 的 站) 及 
a 人 开门 等 )， 接 着 将 恢复 后 图 像 再 以 An 做 降 质 以 预测 该 图 像 ， 记 录 估 测 误差 。 对 其 他 像素 
重复 上 述 动作 以 得 到 平均 的 验证 误差。 

上 述 ML 和 GCY 的 方法 对 相 加 性 噪 表 都 有 和 康 好 的 抗拒 力 , 因 其 推导 过 程 已 把 噪声 考虑 在 
肉 。 这 二 种 方法 的 主要 限制 为 参数 量变 大 时 计算 会 有 问题 ， 且 在 做 最 优化 过 程 时 也 有 收敛 到 
局 部 报 小 点 (local minimay 的 问题 。 


e@ 非 参 数 式 定 型 图 像 限 制 恢复 技术 


这 种 方法 不 需要 建立 原始 或 模糊 图 像 的 参数 模型 ， 故 其 适用 范围 较 广 。 下 面 针 对 常 锌 使 
用 的 三 种 算法 做 讨论 。 

(1) 选 代 育 目 去 着 积 法 (Tterative Blind Deconvolutiom IBD) 

此 方法 最 普遍 采用 的 是 以 快速 傅立叶 变换 为 基础 的 算法 ， 其 方块 图 如 图 6.6-3 所 示 : 


严 佐 ， 
人 0 【加 上 傅立叶 域 的 
条 件 限制 











闻 (号 






产 (m 巾 


加 上 图 像 域 的 
条 件 限 制 







加 上 模 精 的 
条 件 限制 








加 上 傅立叶 域 的 
条 件 限 制 


较 6.6-3 选 代言 良 去 卷 积 法 
一 开始 我 们 假设 一 初始 图 像 ， 接 着 就 在 图 像 与 频率 域 间 交 替 变换 运算 ， 并 在 每 个 过 程 中 将 


志 做 站 到 优 四 
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限制 条 件 考虑 进来 .。 所 加 人 的 条 件 限制 是 根据 对 手边 布 关 图 像 及 PST 的 信息 ， 例 如 图 像 限制 的 
条 件 包 括 将 在 所 考虑 的 某 物 体 图 像 的 区 域 范围 内 (tegion of suppert) 负 值 的 像素 值 以 演 取 代 ， 以 
及 范围 外 的 非 零 像素 以 背景 像素 值 歼 代 等 。 在 第 > 次 进 代 时 ， 傅 立 叶 域 的 条 件 限 制 可 写成 


G 估 站 F 做 站 











万 化, 门 = 元 (6.6-16) 
开 代 :7 -- : 
| 
已 优 ,站 = Ci- 她 1) {6.6-17) 
他 -GD + 一 人 
司 -G 





其 中 “是 相 加 性 噪声 的 能 量 ， 必 须 慎 选 之 才 会 有 较 佳 的 结果 . 

这 种 卫 D 的 方法 有 较 小 的 计算 量 ， 并 且 对 噪 元 有 好 的 抗拒 力 。 主 要 的 缺点 是 不 确保 迁 代 
会 疏 伍 . 另外 ,初始 图 像 对 结果 会 有 相当 大 的 影 啊 . 

(2) 模拟 退火 算法 

MacCallum 的 模拟 退火 (simulated annealing，SA) 算法 的 主要 步 又 是 将 以 下 的 成 本 函数 最 
小 化 


JPm， 7 Rir， 中 -= 也 /wm 四] Am 站- gf 中 {6.6-18) 


此 方法 被 称 为 模拟 退火 的 原因 是 温度 参数 到 必需 缓慢 减少 才 会 使 成 本 困 数 全 整体 最 小 值 
{global minimum)， 和 否则 可 能 收 敏 至 局 部 被 小 值 (local minimumj。 这 种 情况 就 兴 似 液态 金属 冷 
却 时 ， 兆 度 必需 缓慢 下 降 才 会 使 原子 停留 在 稳定 能 阶 。 如 果 和 急速 冷却 ， 可 能 使 原子 停留 在 次 
佳 (suboptimal 的 能 量 状 态 . 

SA 算法 是 很 可 靠 的 方法 . 它 对 抵抗 噬 声 方面 也 有 不 错 的 表现 .主要 的 缺点 是 对 于 一 个 一 
般 大 小 的 图 像 而 言 要 获得 好 结果 所 需 的 计算 量 非常 庞大 。 

G) NAS-RIF 算法 

NAS-RIF (nonnegativity and support constraints Tecursive invetse filtering) 算法 芍 一 个 主 
要 优点 是 PSF 不 必 局 限于 有 限 范围 。 其 方块 图 如 图 6.6-4 所 示 ， 其 中 克 m 阅 为 一 自 适 性 有 
限 脉冲 响应 (FIR) 滤波 器 ，NL 代表 一 非 线性 让 波 器 ， 和 而 误差 信号 etm, 轨 则 通过 像 共 二 梯 度 
最 小 化 法 或 最 大 陡 降 法 等 最 优化 方法 来 调整 wm) 的 滤波 回 系 数 。 有 许多 非 线 性 滤波 器 订 
用 ,例如 


On 车 (me 。 
Z， ”其 他 情况 


其 中 Dap 代 表 所 考虑 的 物体 图 像 范围 内 的 区 域 、 二 则 是 背景 像素 的 色彩 或 灰 度 值 。 


广 oa-| (6.6-19) 
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(入 
图 像 估 宙 


(Po 
Ce 
已 模糊 图 像 (Hb 
寻 玉 JJ) 
最 优化 算 源 


图 6.6-4 NAS-RIF 算法 方块 图 
在 最 优化 算法 上 可 考虑 成 本 函数 如 下 






.JoD= ee 站 十 | 了 (7 9 


可 [mm) fmm] 


一 了 3， 六 oj (6.6-20) 
(me 后 中 
+ [ja-o 右 吉 Zn-i 
(m JE 豆 ， 疏 7 


其 中 万, 是 Du 之 外 的 区 域 ， 变 量 > 则 是 只 有 在 Z 为 零 (全 黑 背 量 ) 时 才 有 非 零 的 值 - 由 于 
上 式 的 成 本 函数 是 凸 装 (convex]， 所 以 这 个 算法 保证 收 伍 到 整体 最 小 值 ， 而 没有 掉 人 局 部 极 
小 值 的 困境 。 

@ 以 高 防 统 计 为 基础 的 非 参 数 法 


这 个 方法 类 似 前 述 NAS-RIF 算法 它 适 合 处 理 纹 理 (texture) 图 像 。 其 方块 图 如 图 6.6-5 
所 示 。 其 必须 最 小 化 的 成 本 函数 反应 出 图 像 的 非 高 斯 特性 。 






mm 阿 
图 像 估 测 


更 新 反 FJR 滤波 眉 
的 高 阶 统计 信息 
哮 6.6-5 ”以 高 防 统 计 为 基础 的 非 参 数 法 方块 图 


这 种 方法 的 主要 优点 是 能 辨别 非 最 小 起 位 (non-minimum phase) 的 PSF、 并 赃 也 有 一 定 的 
抗 干扰 能 力 。 其 主要 的 限制 是 原始 图 像 必 需要 模式 化 成 非 高 斯 概率 分 布 ， 另 一 缺点 是 在 最 小 
化 过 程 中 可 能 掉 人 局 部 极 小 点 。 





2 


自 适 性 FIR 证 波 器 
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ov 习 mm 小 


习 题 


.考虑 一 线性 时 不 变 的 图 像 降 质 系 统 ， 其 访 冲 响应 为 


Mrz-aDy- 有 =exp{-G-o20-D3?] 

假设 系统 的 输 人 图像 是 位 于 x = w 处 ， 宽 度 无 限 小 的 一 条 线 ， 其 模型 为 
Jo 妨 = 5 下 

假设 没有 噪声 ， 试 求 输出 图 像 g(z, 力 。 


. 本 题 是 有 关 交 互 式 (interactive) 图 像 恢 复 的 问题 。 首 先 将 一 幅 图 像 加 和 一 正 艾 (或 余弦 ) 干 


扰 ， 显 示 此 幅 干 扰 后 的 图 像 .看 出 正弦 (或 余 嘴 ) 干 扰 的 特征 了 吗 ? 很 设 你 不 知道 干扰 的 振 
由 及 频率 ， 试 以 交互 式 的 方式 设计 一 带 阻 泪 波 内 将 该 干扰 滤 掉 . 显示 两 个 不 当 的 设计 以 及 
一 正确 设计 的 结果 ， 以 便 加 以 比较 。 


. 投 一 点 扩散 函数 PSF 所 形成 的 矩阵 为 {Rma}， 其 中 


号 ， 天 ,下 一 站 ,2 
0， ”其 他 情况 


J 则 在 mm = 0123 下 有 定义 ， 试 写 出 如 (6.1-3) 至 (6.1- 力 式 的 形式 - 


有 mm 二 | 


. 证 明 (6.1-9) 式 成 立 。 

. 根据 (6.1-9)] 式 找 出 伴随 第 3 题 的 扩散 符 阵 fm 的 抢 阵 环 与 五。 

. 以 第 3 题 为 例 ， 验 证 刺 … 相 当 于 一 取 傅 立 叶 变换 的 算 子 。， 

,设计 一 简单 实验 ， 可 看 出 对 降 质 狼 像 实现 最 小 事 方 恢复 法 的 效果 并 实际 实现 之 。 
,假设 一 图 像 中 有 两 个 独立 物体 ， 其 各 别 的 范围 设 为 已 知 、 经 某 个 图 像 模 糊 系 统 (例如 


(6.6-7) 及 (6.6- 介 式 ) 及 加 人 所 知 的 曝 声 后 得 到 某 个 降 质 图 像 ， 此 时 各 物体 的 范 畦 由 于 模 
糊 的 关系 会 扩大 而 超出 原 物 体 的 范围 。 试 设计 一 简单 实验 ， 以 闪 代 育 目 去 卷 积 法 实现 图 
像 焦 复 ， 并 讨论 实际 上 碰 到 的 困难 。 
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许多 问题 的 产生 是 由 于 资源 有 限 ， 而 为 了 突破 各 种 的 限制 ， 自 然 就 有 各 种 解决 的 方案 . 
数据 压缩 可 以 说 是 在 存储 及 传输 方面 的 限制 之 下 所 发 展 出 来 的 : 

对 艾 像 压缩 的 研究 可 追溯 至 数 十 年 前 。 最 初 研究 的 重点 是 放 在 减少 图 像 传输 带宽 的 模拟 
方法 上 ， 称 为 带宽 压缩 (bandwidth compression) 处 理 。 由 于 数字 计算 机 的 出 现 及 甚 后 先进 的 
集成 电路 的 发 展 促使 研究 注意 力 从 模拟 转向 数字 的 此 缩 方法 : 20 世 纪 40 年 代 ,C.E, Shanmnen 
等 人 首先 从 概率 观点 来 看 传输 与 奈 缩 、 黄 定 了 图 像 压 缩 的 理论 基础 . 近年 来 ， 随 着 若干 个 重要 
的 图 像 床 缩 国际 标准 的 通过 ， 促 进 了 理论 的 实际 应 用 使 图 像 压 缩 领域 出 现 重 大 进 诬 。 

区 像 入 缩 的 目的 是 减少 表示 数字 图 像 所 需 的 数据 量 ， 减 少数 据 量 的 基本 概念 是 去 除 重复 
多 余 的 数据 ， 而 此 苑 余 性 又 与 数据 间 的 相关 性 成 正比 从 数学 和 角度 米 看 . 压缩 是 将 相关 性 高 
的 像素 阵列 变 成 统计 上 较 无 关 的 数据 集 的 一 种 变换 .此 种 变换 使 用 在 图 像 储存 和 传输 之 前 . 
之 后 ， 被 压缩 的 图 像 再 被 解压 缩 以 重建 原来 的 图 像 或 它 的 近似 值 . 本 章 将 介绍 殴 像 数据 的 部 
余 性 、 图 像 品 质 的 评估 及 各 种 常用 的 图 像 压 缩 法 .。 


7.1 数据 编码 与 数据 压缩 


在 数据 大 量 流 通 的 今天 ， 正 缩 所 扮演 的 角色 也 日 益 重 要 : 由 于 正 缩 使 数据 量 减少 ， 进 而 
使 数据 传输 时 间 能 降低 ， 让 传输 的 效率 更 为 提高 : 在 传输 带宽 有 限 ， 扩 充 不 易 以 及 增加 传输 
设备 将 提高 成 本 的 考虑 下 ， 下 缩 提供 了 另外 一 种 解决 方案 . 

压缩 也 易于 产生 保密 的 效果 、 由 于 压缩 过 程 对 于 数据 重新 编码 ， 改 变 原 有 数据 的 外 狐 ， 
接收 的 对 方 要 是 没有 相对 应 的 解 讨 缩 程序 就 难以 恢复 。 即 使 有 意 要 般 解 ， 因 为 原 有 数据 的 许 
多 特性 已 经 改变 ， 故 较 不 容易 被 搞 测 出 来 。 

一 个 数据 压缩 系统 会 包含 两 个 搭配 的 子 系统 ,一 为 压缩 器 (compressor) 或 是 编码 器 
(encoder)， 另 一 为 解压 器 (decompbressor) 或 是 解码 器 (decoder) 。 其 关系 如 图 7.1-1 所 示 ， 其 中 
A 代表 球 缩 前 的 数据 ，B 代表 正 缩 后 的 结果 ，A' 则 代表 了 经 过 解压 缩 过 程 得 到 的 结果 :. 一 个 
理想 的 数据 压缩 系统 将 会 满足 下 列 两 个 特性 ， 

(As A 

(2) Size {B)J<size (A) 

其 中 A = A' 代 表 解 压缩 后 的 数据 和 原始 的 数据 间 不 能 有 太 大 的 差距 ，size(B) < size(A) 表示 
讨 缩 后 的 数据 所 需 的 储存 空间 必须 小 于 原始 数据 所 需 的 储存 室 间 ， 以 节省 储存 空间 或 减少 传 
输 时 间 。size (AjAsize(B) 可 定义 成 压缩 率 (compression ratio); 表示 压缩 的 程度 。 


图 7.1-1 数据 压缩 系统 方块 图 
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7.1-1 数据 相关 性 


数据 压缩 一 词 是 指 按 所 要 求 的 信息 品质 去 缩减 数据 量 的 一 种 处 理 。 我 们 必须 分 清楚 数据 
生 信 息 之 间 芍 区 别 。 数 据 是 指 传 递 信息 的 载体 ， 同 样 的 信息 可 以 用 不 同 量 的 数据 来 代表 。 假 
如 我 们 有 一 个 喜欢 唆 唆 不 体 的 人 与 另 一 个 总 是 讲话 简短 扼要 的 人 来 进 同 一 个 故事 ， 这 里 我 们 
感 兴趣 的 信息 是 故事 ， 广 言语 便 是 用 来 表达 信息 的 数据 .如 果 这 两 个 人 分 别 用 他 们 不 同 数量 
的 语 训 来 氮 述 同一 个 故事 ， 这 就 产生 了 局 一 故事 的 不 同 版 本 ， 其 中 至 少 有 一 个 版 本 含有 非 必 
要 的 数据 。 这 些 数 据 (或 叫 言语 ) 不 是 提供 一 些 无 关 紧 要 的 信息 就 是 简单 重复 一 些 时 己 知 道 的 
东西 。 这 就 是 上 所谓 数 据 的 元 余 性 (fedundancy). 

对 于 数字 图 像 压 缩 ， 有 三 种 基本 的 数据 元 余 性 可 以 运用 ， 即 : 编码 fcodingy 元 余 性 ， 像 
素 间 (intermpixeD 元 余人 性 ， 及 视觉 fbsychovisual) 抑 余 性 、 消 除 或 缩减 上 述 三 种 元 余 性 的 一 种 或 
多 种 ， 就 可 以 得 到 数据 压缩 的 效果 。 以 下 分 别 叙述 这 三 种 宛 余 性 - 


@ 编码 元 余 性 


在 一 图 像 中 ， 各 个 藉 度 出 现 的 机 率 往 往 不 完全 相同 ， 老 不 考虑 此 特性 ， 一 律 采 用 自然 二 
进 制 码 来 表示 ， 则 往往 会 有 编 玛 元 余 性 的 产生 - 为 了 使 编码 更 有 效率 ， 因 此 对 出 现 福 率 较 大 
的 灰 度 分 配 以 较 少 的 位 长 度 ， 以 达到 数据 压缩 的 目的 。 此 过 程 称 为 可 变 字 长 编码 
{variable-length coding)。 
@ 像素 间 元 余 性 

通常 将 原始 图 像 信号 通过 某 种 变换 来 解除 图 像 信号 加 的 相关 性 ， 亦 即 除去 与 图 像 中 像素 
闻 相 关 性 直接 有 关 的 元 余 性 。 因 为 任 一 指定 的 像素 其 度 值 篆 可 由 邻近 的 像素 灰 度 值 作 一 适当 
的 预测 ， 因 此 各 像素 所 携带 的 信息 量 相对 减少 。 为 了 减少 像素 间 的 相关 性 ,通常 通过 变换 或 
称 为 蟾 射 (napping) 来 完成 ， 例 如 第 四 章 中 所 讨论 过 的 DCT、FFT 及 DWT 等 ， 而 原始 的 图 
像 可 以 由 这 些 变换 的 数据 通过 其 反 变 换 再 完全 重建 ， 因 此 这 种 映射 通常 为 可 逆 的 。 
昌 视觉 元 余 性 

所 谓 视觉 元 余 性 是 指 可 以 被 山 去 而 对 图 像 的 主观 品质 不 会 造成 太 大 影 响 的 元 余 性 。 在 一 
般 情况 下 我 们 不 会 对 个 别 像 素 作 定量 分 析 以 取得 图 像 信 息 . 六 是 寻找 一 些 诸如 边界 或 纹理 的 
特征 ， 并 将 它们 组 成 可 辨识 的 群体 ， 以 便 大 脑 完 成 对 图 像 的 理解 。 由 于 某 些 数据 对 正常 视 党 
观察 不 是 那么 重要 ， 因 此 得 以 被 删除 .这 个 过 程 称 为 量化 处 理 : 而 视觉 元 余 性 被 删除 ， 造 成 
某 些 信息 的 损失 ， 因 光量 化 过 程 并 非 一 可 逆 的 过 程 ， 因 谊 导致 所 谓 有 损耗 的 数据 压缩 详 见 
7.5 节 。 





7.1-2 保 真 度 准则 


如 前 所 述 ， 由 于 视觉 元 余 性 的 删除 会 导致 视觉 信息 的 损失 ， 因 而 重要 的 信息 也 可 能 被 
亚 失 .因此 需要 一 个 本 癸 量 信息 丢失 的 准则 。 此 准则 通常 可 分 两 大 类 : 客观 保 真 度 准则 
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fobjective fidelity criteriom) 以 及 主观 保 喜 度 准则 (subjective fidelity criteriom)。 

当 信息 损失 的 程度 可 以 表示 成 原始 输入 图 像 与 经 过 压缩 及 解压 缩 的 输出 图 像 的 函数 时 
这 种 量 测 就 是 客观 的 保 真 度 准 则 。 输 和 人 与 输出 图 像 亲 的 均 方 根 误差 即 为 一 例 . 假设 Fw 术 表 
示 输 入 图像， 则 将 此 图 像 经 过 压缩 与 解压 缩 所 得 的 图 像 六 m,m 代表 Ar 站 的 个 测 值 或 近似 
值 。 对 任意 的 产 与 n 值 ， jn 丰 与 Am 站 之 间 的 误差 elm, 四 可 以 定义 为 


etpp 站 = 产 oa 门 ~ 0m 站 (7.1-1) 
故 整 幅 图 像 误 差 平方 的 总 和 为 
袜 六 [7 下 0.1.2) 


此 处 图 像 的 大 小 为 寻 xW 。 因 此， 人 亲 与 From 之 间 的 均 方 根 误差 e。， 便 是 误差 的 平方 
在 Mx 阵列 内 取 平均 值 的 平方 根 ， 即 


1 
有 -1 3 


erm = 入 半 立 U oo-/ 册 (7.1-3) 


与 客观 保 真 度 准 则 息息相关 的 是 经 过 压缩 与 解压 缩 图 像 的 均 方 信 唆 比 (mean-square 
signalto-noise ratioj。 如 果 把 六 me 站 看 成 为 原始 图 像 Fa) 与 噪声 信号 elm, 四 之 和 ， 则 葵 出 
图 像 的 均 方 信 咯 比 用 SNR ， 表示 为 


上 季 一 1 加 一 


了 


SNR ”= Hi=0 ns (7.1-4) 


mW 


之 三 [om-yoo] 
信 噪 比 的 均 方 根 值 . 用 SNR ,， 表示， 则 可 由 上 式 取 平 方 根 而 得 。 

为 一 种 文献 上 常 采用 的 客观 保 真 度 称 为 峰值 信 品 比 Ceak SNR， PSNR)， 其 定 光 是 将 
(7.14) 式 的 分 子 整个 以 到 代 换 之 ， 其 中 了。 是 图 像 所 容许 的 最 大 值 ， 例 如 对 一 个 8 位 的 图 
像 了 .= 255 ， 此 外 ， 一 般 以 分 贝 (dB) 计算 ， 因 此 必须 再 取 10 为 底 的 对 数 . 再 雪 以 10 才 是 
最 后 所 求 。 

虽然 客观 保 真 度 准则 提供 了 一 种 简单 日 方便 的 估算 信息 损失 的 方法 ,但 大 老 数 的 解压 缩 
图 像 的 最 终 观 察 考 还 是 人 。 因 此 ， 用 观察 者 主观 评估 来 衡量 图 像 品质 往往 更 为 合适 。 其 作法 
为 : 选 一 部 分 适当 的 观察 着 代表 .让 他 们 对 拱 型 的 解压 旨 图 像 评分 ， 然 后 取 平 均 分 数 。 评 分 
可 以 用 一 种 绝对 等 级 尺度 或 对 /ma 人 与 rm 站 做 出 对 照 比 较 表 7.1-1 表示 一 种 可 用 的 绝对 
等 级 扩 度 。 对 照 比 较 则 可 应 用 尺度 如 1- 3，- 2，- 1，0，1,， 2，31 分 别 代表 主观 评价 ! 很 差 ， 
较 差 ， 稍 差 ， 相 同 ， 稍 好 ， 较 好 ， 很 好 }。 不论 哪 种 情况 的 评分 .都 可 说 是 以 主观 保 真 度 为 淮 
列 的 - 
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表 71-1 电 杭 画 质 的 等 级 尺度 


秀 “| 要 求 图 像 有 极 高 品质 
的 “| 报 供 可 欣赏 的 高 品质 图 像 ， 干 扰 玫 讨厌 
烙 “| 图 像 品质 可 和 接受， 干扰 不 讨厌 














勉强 及 格 | 图 像 品 质 低 ， 王 扰 有 些 讨 厌 
狗 等 的 图 像 很 差 ， 但 尚 能 看 ， 十 扰 明 吕 
轿 像 差 到 不 能 看 














7.2 图 像 压缩 模型 


在 上 一 节 中 我 们 讨论 了 压缩 一 幅 图 像 表 示 所 需 的 三 种 数据 元 余 性 。 运 用 这 些 元 余 性 可 建 
立 一 个 实用 的 图 像 压缩 系统 。 本 节 将 考虑 此 系统 的 所 有 特性 并 以 一 个 通用 的 模型 来 表示 。 

如 图 7.2-1 所 示 , 一 个 压缩 系统 有 两 个 主要 部 分 , 即 编码 器 与 解码 器 . 将 输 人 图 像 FA(m 门 
送 进 编 码 器 后 ， 编 码 器 便 根据 输 人 数据 产生 一 组 符号 。 经 过 信道 {channe]) 传输 后 送 至 解码 
器 ， 由 解码 器 输出 一 重建 图 像 fr, 站 。 一 般 说 来 ， 产 mm, 四 可 以 和 rm 站 完全 相同 或 有 所 不 
同 。 若 完全 相同 ， 则 该 系统 是 无 失真 的 或 信息 保持 的 ; 反之 ， 则 重建 图 像 会 有 一 定 程 度 的 失 
真 。 

编码 器 由 信 源 编码 器 与 信道 编码 器 所 组 成 。 前 者 删 去 输 人 元 余 性 ， 后 者 则 增强 信 源 编码 
器 输出 前 抗 干 拓 能 力 。 解 码 器 则 包括 信道 解码 器 及 与 之 相连 结 的 信 源 解码 器 。 如 果 在 编码 右 
与 解码 器 之 间 的 信道 是 无 噪声 (不 易 发 生 错误 ) 的 . 则 信道 编码 器 与 解码 器 可 省 去 ， 于 是 编码 
器 与 解 袜 器 就 简化 成 为 信 源 编码 带 与 解码 器 了 。 


mt 由 


mm 





7.2.1 通用 的 压缩 系统 模型 


7.3 信息 论 基 础 
7.3-1 信息 度量 


信息 论 的 基本 前 提 是 信息 的 产生 可 用 一 个 符合 直觉 的 方法 来 度量 ， 其 中 一 个 成 功 的 度量 
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方式 是 以 概率 的 模型 来 表示 。 设 有 一 个 随机 事件 巨 ， 它 的 发 生 概率 为 已 EE)， 则 称 它 包 售 有 


TI 
PE 


单位 的 信息 。 量 全 ) 常 称 为 五 的 自信 息 量 (selfinformatiom)。 一 般 耐 言 ， 由 事件 互 所 引起 的 
自信 息 量 与 鼠 的 概率 有 倒数 的 关系 。 如 果 PE ) = 1{ 即 事件 总 是 发 生 )，7(E) = 0， 即 它 不 提供 
信息 。 这 是 因为 该 事件 不 带 有 任何 不 确定 性 , 当 告知 该 事件 已 经 发 生 时 ， 并 不 提供 什么 信息 . 
但 是 ， 如 果 PE ) = 0.99， 当 告知 该 事件 已 经 发 生 时 ， 还 是 传递 了 一 点 信息 . 若 告知 吾 并 没有 
发 生 ， 则 传递 了 更 多 信息 ， 因 为 这 个 结果 是 不 大 可 能 的 . 

土 式 中 对 数 的 基底 决定 度量 信息 的 单位 。 如 果 对 数 的 基底 为 *， 则 信息 的 度量 为 > 进 制 
单位 。 如 果 选 择 2 为 基底 ， 则 信息 量 的 单位 为 位 tb 让 。 


T(E)=log 





=-log P(B) (7.3-1) 








7.3-2 信 道 


考虑 图 73-1 所 示 的 简单 信息 系统 . 设 信息 源 的 可 能 符号 为 A = fabyaasai， 其 中 对 应 
产生 的 概率 集 为 向 量 z= [P(e)，Plezj…， Pa 站， 其 中 Fan) 为 产生 字 元 符号 w 的 概率 。 假 设 
有 天 个 符 叶 源 产生 ， 则 由 大 数 法 则 可 知 . 若 丰 够 大 ， 必 平均 会 输出 tP(aoJ) 次 ， 因 此 由 上 个 输出 
所 得 的 平 沟 自 信息 量 为 


一 立 iPle ) log Po) (7.3-2) 
jal 





于 是 观察 每 个 信息 源 输 出 所 得 的 平均 信息 量 芯 Z) 为 
刀 (z)= - 们 Pla log Pa )) (73-) 


Ge) 称 为 信息 源 的 不 确定 性 (unecertainty) 或 精 (entropy)- 





讯息 使 用 者 


图 7.3-{ 一 个 简单 信息 系统 的 示意 图 


接着 看 信道 的 影响 。 设 信道 输出 的 可 能 符号 集 为 日 = {up2…50j， 其 对 应 的 概率 集 
为 ?= [PP Pb] ， 其 中 Pen 为 产生 符 叶 收 的 概率 。 由 完全 (total) 概率 可 
知 


由 
Pa)= Pa lajpleai) (7.3.4) 
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其 中 Pa |a,) 代表 条 件 概 率 。 为 方便 起 见 可 将 所 有 的 条 件 概 率 以 信道 (转移 ) 矩阵 来 表示 


Pa Pa Peia) 
o- Pala0) Po) … Pale) 73.5) 
Ps 1a,) Ples 1) L Psloay) 
因此 整个 输出 符号 的 概率 分 布 为 
= 人 (7.3-g 


接 下 来 我 们 要 知道 具有 信道 垂 阵 中 的 信道 的 容量 (capacity) 。 首 先 我 们 计算 在 信息 使 用 者 观 
察 得 某 一 个 输出 关 的 情况 下 ， 信 息 源 的 ， 即 


已 (z|8)= 袜 Ple | 呈 )log Pa 15 (7.3.7] 
对 上 式 中 所 有 所 取 期 望 值 或 平均 得 

Re-= 立 Bela)PG 073.8 
上 式 经 简化 后 得 

百 (z| 人 = 这 > Pa 已 )log Pa | 及 ) (7.3.9) 


其 中 Pen 的 为 g 与 失 的 联合 概率 。 其 意义 为 在 观察 得 一 个 输出 符号 下 , 一 个 信息 源 符 导 的 
平均 信息 量 。 因 为 再 四 是 在 未 观察 得 输出 符号 前 ~- 信息 符号 的 平均 信息 量 ， 所 以 感 Gg) 与 
豆 (g| 轨 之 差 代 表 观 察 得 一 个 输出 符号 所 获得 的 平均 信息 量 。 此 差 量 称 为 xz 与 ?的 互 (nutual) 
信息 量 ， 表 示 成 稚 几 


Je 赔 = 甩 Ga - 玖 zx 由 (7.3-10) 


将 成 gj 与 吾 (z| 加 以 (73-3) 式 及 (7.3.9) 式 代 人 ， 再 利用 Pa) = Play 5 + Po 的 + + Plan 
6 的 事实 可 得 


国 忆 世 Pai:ax) _ 
zz 四 = 乞 辣 Fe ) log FEOJ JP (7.3-11) 
上 式 可 进一步 简化 成 
J 用 
T(z 人 = > Pai)dn log 一 和 (7.3-12) 


和 > Penw 
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其 中 9 = Po ia)) 。 换 言 之 ， 观 察 得 信道 的 一 个 输出 所 收 到 的 平 欧 信息 量 与 信 源 的 概率 分 
布 ? 及 信道 矩阵 有 关 当 输 和 与 输出 符号 为 统计 无 关 时 , 其 你 赔 = 0 为 最 小 值 因为 此 时 Popa 
= PajPab。 在 所 有 可 能 的 概率 分 布 s 中 请 四 的 最 大 值 即 是 通道 矩阵 中 所 呈现 的 信道 容量 
C。 亦 即 
C=Imax[y(zyjj (7.3-13) 

此 信道 容量 定义 出 可 在 此 信道 可 靠 传送 的 最 大 速率 。 些 外， 信道 容量 与 信息 源 的 输入 概率 无 
关 ， 只 与 定义 信道 的 条 件 概率 有 关 。 

我 们 举 一 个 例子 来 说 明 以 上 所 提 到 的 观念 ， 考 上 奈 一 个 二 元 信息 潜 ， 其 符号 集 4 = faljaz} 
= {0,1}， 其 中 对 应 的 概率 分 别 为 Paej) =p 及 上 gj=1-5= 五 。 由 (7.3-3) 式 可 得 此 信息 源 的 
粒 为 


五 (Z) 一 一 训 iog: 己 一 万 log: 万 


此 式 只 与 疡 有 关 日 上 式 等 号 右边 称 为 二 元 炳 函数 (binary entrepy 如 nction) 表示 成 总 (.)。 图 
7.3-2 fa) 是 示 此 函数 .图 中 显示 当 p =152 时 ， 此 贡 数 有 最 大 值 (1 位 )。 
设 传 输 信 道 是 错误 概率 为 咏 的 二 元 对 称 信 道 (binary sytmmetric channel, BSC)， 其 信道 矩 


阵 为 
o-| P。 上 | 
站 。 上 一 且 。 卫 。 忆 
对 一 个 二 元 输入 ，BSC 的 输出 符号 集 好 = {58} = {0,1)。 由 07.3- 例 式 知 其 对 应 的 概率 为 
区 
站 。 及 | | PPD+D| PC) 
现在 由 (7.3-12) 式 计 算 BSC 的 互信 息 营 可 得 


GE 由 = 好 (PP + 万 玉 ) 一 (pa) 


图 7.3-2 人 b) 显示 在 某 个 固定 的 六 时 ，jf, 必 对 的 曲线 图 形 。 由 图 中 可 看 出 , 当 P =0 或 上 时 
孢 ,有 =0， 此 与 直觉 相符 ， 因 为 永远 国定 只 传送 0 或 1， 所 以 收 到 任何 一 位 时 没有 因而 增 山 
任何 新 信息 ， 即 下 = 豆 g 榴 、 肉 此 jc, 凡 = 0。 友 ,9 的 最 大 值 发 生 在 两 位 有 同等 概率 时 ， 此 
时 所 得 的 新 数据 具有 最 不 确定 性 ， 因 而 收 到 最 大 的 信息 量 . 由 (7.3-13) 式 及 图 7.3-2 (b 中 对 
所 有 摄 率 分 布 z= [pP,1-p] 所 得 到 的 放 , 站 图 中 可 知 


(=1 一 屿 (Pa 


如 图 7.3-2 (ec) 所 示 。 当 =0 或 1 时 ，C 最 大 (1 位 7 字 元 符号 )， 此 时 信道 的 输出 完全 可 以 
预期 。 但 是 当 me = 172 时 , 信道 的 输出 完全 不 可 预期 , 因此 任何 信息 都 无 法 通过 此 信道 传输 。 
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时 1 卜 
填 ' 
业 区 
这 志 
叫 
冯 到 
-地 
问 
172 1 概率 户 1 。 概率 户 
{a] 二 元 炳 天 数 也 ) 二 元 对 称 信 道 全 SC) 的 互信 息 量 
各 
趟 ' 
上 
了 
籼 
施 
1 概率 P。 
(cj) BSC 的 容量 


图 7.3-2 ”三 个 二 元 信息 画 数 


7.3-3 ”基本 编码 定理 


本 节 将 介绍 三 个 有 关 编 码 的 基本 定理 : (1) 无 呆 声 (hoiseless) 下 的 编码 定理 ; (2) 有 嗓 声 
(noisy) 下 的 编码 定理 ; 人) 信 攻 (souree) 编码 定理 。 无 噪声 影响 使 得 一 个 通讯 系统 中 数据 传送 
可 以 没有 任何 错误 ， 因 此 无 噪声 下 的 编码 的 重点 在 十 如 何以 最 得 的 平均 码 长 很 精简 地 来 表示 
每 个 字 元 符号 。 有 虽 声 影响 使 得 一 个 通讯 系统 中 数据 传送 容易 发 生 错误 ， 因 此 有 陈 声 下 编码 
的 重点 在 于 如 何 提供 可 靠 的 通讯 ， 减 少 错误 发 生 。 信 源 编 码 的 精 散 是 假设 在 无 唆 声 信道 中 ， 
在 某 个 失真 范围 内 如 何以 最 小 的 位 率 将 信息 传送 给 使 用 者 。 换 言 之 ， 这 是 一 个 讨论 位 率 与 失 
真 程度 间 权 衡 取舍 的 一 个 定理 ， 也 是 率 失 丙 (rate-distortiom) 理论 中 非常 重要 的 结果 。 


急 无 噪声 下 的 编码 定理 


此 定理 又 称 仙 农 (Shannon) 的 第 一 定理 。 考 虑 一 无 记忆 信 源 ， 亦 即 其 字 元 符 汪 为 统计 独 
立 。 设 4 = fa az …sq 仍 为 可 能 的 字 元 符号 集 ， 其 对 应 的 概率 仍 为 Po), Plezj…, Pd， 车 
以 = 个 字 元 符号 为 一 个 输出 单元 ， 则 总 共 可 能 有 .j" 个 可 能 的 值 ， 令 此 值 的 集合 为 
= 他 ,oosQj， 其 中 每 个 w 是 由 4 中 的 个 字 元 符号 所 组 成 。 设 Pta ) 为 伴随 ex 的 概 
率 ,因此 
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Po = Pa)Pe Pan) (7.3-14) 


其 中 必 的 额外 下 标 是 指明 形成 w 的 个 字 元 符号 。 设 也 = {P(a) Pa ) ,Pta ,)}， 则 其 焙 
为 


瑟 ( 太 = -六 PoiiogPloy) 


将 (7.3-14) 式 代 人 上 式 中 并 化 简 后 可 得 
瑟 ( = rm 人 (7.3-45) 





国 wm 的 自信 息 为 iog 因此 - -个 用 来 代表 上 的 码 字 的 合理 整数 长 度 太 cr ) 应 为 


1 
Po 


了 1 
Te 了 Te 
FJ ) 和 08 FIO 


上 式 乘 上 以 w, ) 并 对 所 有 浴 痪 和 可 得 


log 十 (7.3-16) 




















机 1 旨 | 
之 Pa ylog Ps 之 Pfw Way< 之 Pa )1log Fr +1 
或 可 写成 
召 {Z 拼 卫 sn 必 五 {z +1 (7.3-17) 
其 中 心 。 代 表 码 字 的 平 询 长 度 . 将 上 式 除 以 靖 并 利用 (7.3-15) 式 可 得 
元 1 
所 (和 守 一 立 五 (中 十 一 全 .3-19) 
开 如 
取 其 极限 变 成 
态 ， 
| | = 万 (z] (7.3-19) 
网 一 中 De 天 


《7.3-19)] 式 是 说 如 果 我 们 考虑 一 次 取 无 限 长 字 元 符号 来 编码 ， 理 论 上 此 编码 结果 可 任意 逼近 
瑟 @， 而 这 正 是 疡 。 /的 下 办 ,因此 编码 效率 (efficiency) 了 可 定义 成 





-人 或 -1 如 
了 = 斑 或 9 = 也 (7.3-20) 


8 aa 
状 


e@ 有 了 噪声 下 的 编码 定理 
此 定理 又 称 仙 农 的 第 二 定理 。 在 有 噪声 信道 的 情况 下 ， 我 们 较 关 切 的 是 信息 传送 可 以 多 
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么 可 靠 ” 此 定理 是 说 ， 已 知 一 离散 噪声 无 记忆 信道 的 容量 为 C， 且 有 一 正 速率 为 六 的 信 源 
其 中 只 < C， 则 存在 有 一 种 编码 ， 使 信 源 输出 在 此 信道 传输 时 ， 具 有 和 侍 意 小 的 独 误 概率 。 此 
定理 预测 在 有 只 声 存在 时 ， 可 以 称 得 上 是 无 错误 的 传输 ,不 过 此 定理 只 告诉 我 们 有 这 种 码 的 
存在 ,并 未 告诉 我 们 如 何 梅 造 这 些 码 。 这 个 问题 属于 信道 编码 [channel coding) 或 错误 更 正 码 
(errot cormecting code) 的 领域 ， 己 超过 本 书 的 范围 . 故 不 再 继续 讨论 。 首 兴趣 的 读者 可 以 在 
图 书馆 找到 专门 讨论 本 问题 的 参考 书 智 。 
昌 信 源 编码 定理 

先前 曾 以 信道 答 阵 & 代 表 信 源 输 出 至 接站 端 产生 错误 状况 的 一 -种 模型 。 鼻 设 信道 传输 不 
再 有 任何 错误 的 可 能 ， 而 接收 端 解码 所 得 与 信 源 输出 之 间 的 唯一 误差 是 来 自 数据 压缩 与 解压 
缩 间 的 失真 。 此 时 可 沿用 年 阵 @ 的 概念 ， 将 其 当成 此 失真 情况 的 另 一 个 模型 。 此 时 矩阵 中 一 - 
元 素 go 代表 一 个 信 猴 符号 w， 经 编码 与 解码 的 过 程 得 到 输出 符号 六 的 概率 ， 

令 Pa , 记 ) 找 表 上 述 失 真 度 。 对 所 有 符号 的 平均 失真 了 (人 可 写成 


% 


[> 


aq( 人 = 之 记 PaporEta 旋 ) 


ku 
上 用 
了 
一 


If- 
[v> 


PIGj JP 9 {7 32 了 


山 
Pim 
册 


设 4 (外 小 于 或 等 于 万 的 所 有 编码 解码 过 程 的 转移 概率 集合 为 
尼 o = 地 和 4 人 和 妆 {7.3-22) 


因为 每 -~ 个 编码 解码 过 程 是 由 一 个 假想 的 信道 矩阵 和 所 定义 ， 所 以 观察 一 个 解码 器 输出 所 获 
得 的 信息 可 参照 (7.3-12) 式 来 计算 。 因 此 我 们 再 定义 出 一 个 失真 函数 


ARCDD)= 了 anE(z] (7.3-23] 


上 式 定 义 了 在 平均 失真 小 于 或 等 于 刀 的 条 件 之 下 ， 信 源 可 以 传 给 使 用 者 的 最 小 码 率 。 要 计算 
RD)， 可 在 下 列 条 件 限 制 下 选取 适当 的 @ 使 kz 轨 最 小 化 ; 


4 =0 (7.3.24] 
此 
9b =1 (7.3-25] 
目 =1 
以 及 
dO) = (7.3-26) 


其 中 (7.3-24) 与 (7.3-25) 式 是 由 信道 矩阵 的 基本 性 质 而 来 ，(7.3-26) 式 则 表示 最 小 的 信息 失真 
码 率 出 现在 最 大 可 能 失真 时 。 
一 个 典型 的 率 失 嘉 函 数 如 图 7.3-3 所 示 。 通常 只 有 对 于 简单 的 信 源 以 及 简单 的 失真 测度 
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才 有 可 能 应 解 析 的 方式 获得 率 失真 图 数 ， 因 此 大 多 需要 有 适当 的 法 代 算 法 在 计算 机 上 计算 出 
所 需要 的 及 (CD) 国 数 、 


率 失真 函数 RD 


失真 卫 
图 7.3-3 一 个 典型 的 率 失真 函数 图 形 


7.4 无 失真 压缩 


在 某 些 数字 信和 号 应 用 中 ， 无 失真 压缩 是 较 能 被 接受 的 减少 数据 的 方法 : 例如 许多 医学 或 
公务 文件 的 图 像 ， 由 于 法 律 的 因素 ， 有 损 压 缩 一 般 而 言 并 不 适用 ; 另 一 种 应 用 为 大 地 卫星 图 
像 的 处 理 ， 无 论 是 应 用 还 是 数据 采集 的 代价 部 较 高 ， 因 而 不 希望 信息 有 损失 ; 还 有 一 种 是 数 
字 导 光 摄 像 , 在 此 处 任何 信息 的 损失 都 可 能 会 影响 诊断 的 正确 性 . 本 节 中 将 针对 目前 通用 的 
无 失真 压缩 方法 进行 讨论 . 

急 访 长 编码 
假设 有 一 原始 符号 序列 为 


后 GCTGG4G0G3G2G1G4G1G 


其 中 售 四 个 符号 元 素 mi 、w 、 心 ，a4， 故 可 编 但 为 











于 是 我 们 可 以 把 该 符号 序列 储存 为 
和 人生 | 全 全 | 人 | 人 
Tauloololoaolalohiolaroliorloo 


0 其 实际 出 现 次 数 统计 如 
下 : 四 有 8 次 , 呈 有 2 次 ,ae 有 1 次 ，a 有 4 次 。 于 是 我 们 把 编码 的 方式 改 为 
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内 需 用 25 位 来 表示 ， 这 就 是 变 长 编码 的 基本 构想 . 


@ 翟 夫 沁 编 码 


堆 夫 村 (Huaftinan) 编码 是 由 D. A，Huffman 于 1952 年 提出 ， 当 时 发 表 在 一 篇 名 为 “A 
Method fbr the Consttuction of Minium Redundancy Codes” 的 论文 上 ， 当 对 信 源 符号 一 次 一 个 
个 别 编 码 时 ， 和 起 夫 曼 编 凤 对 每 个 原始 符号 所 产生 的 码 其 有 最 短 的 平均 码 长 ， 因 此 是 最 佳 的 纺 
很 

霍 夫 曼 法 首先 祖 据 所 考虑 的 诛 始 符号 的 概率 大 小 顾 序 产生 一 个 原始 码 序 列 ， 接 着 合并 两 
个 最 小 概率 的 符号 为 一 个 新 符号 并 如 人 下 一 次 缩减 。 图 7.4-1 显示 一 霍 夫 螺 编 码 的 过 程 . 在 
图 的 最 左边 ,一 个 趾 构 的 诛 冶 符 导 及 其 概率 集合 ， 从 上 到 下 依照 概率 的 递减 顺序 排列 。 为 了 
构成 第 一 次 原始 码 的 缩减 ， 底 部 的 商 个 概率 0.06 与 0.04 被 合并 成 一 个 复合 符号 .其 概率 为 
0.1。 该 符号 被 置 于 第 一 次 原始 码 缩减 列 并 仍 按 递减 顺序 排列 ， 这 样 的 过 程 一 直 重 复 到 缩减 的 
原始 码 剩 下 两 个 符号 为 止 。 


碌 来 信 涉 信 源 缩减 
符号 概率 1 2 3 4 


@) 0.4 0.4 个 4 0.4 0.6 

本 0.3 人 .3 0.3 0.3 十 0.4 
01 1. 人 2 0.3 

如 1 和 .1 和 .1 十 0.1 

3 0.06 “ 0.1 

Gs 0.04 0.1 


国 7.4-1 才 夫 曼 玛 的 设计 过 程 


最 后 ， 从 剩 下 的 两 个 符号 码 开始 回调 到 最 初 的 原始 担 进 行 编码 。 此 时 分 配给 两 个 符号 最 
短 长 度 的 代码 ， 即 0 与 1， 如 图 7.4-2 所 示 (或 分 配 成 1 与 0) 出 于 概率 0.6 的 缩减 符号 是 由 
它 左边 的 两 个 缩减 符号 合并 的 ， 所 以 它 的 代码 0 也 应 属于 前 面 两 个 符号 ， 同 时 也 附加 上 0 与 
1 (或 1 与 0 但 需 与 前 面 一 致 )， 这 样 的 步骤 一 直 重复 地 对 所 有 缩减 符号 进行 ， 直 到 最 初 的 符 
号 为止 。 最 后 产生 的 码 字 显 示 于 图 7.4-2 的 左 方 。 该 编码 的 平均 长 度 为 
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一 1040D+(0.3N2+(0DG)+IOM4)TIOO6NKSI + (0.041S) 


=2.2 (位 /三 元 ) 





该 信 波 的 为 2.14 位 “符号 ， 故 霍 夫 曼 码 的 效率 为 2.1472. 







0.41 1 





0 43 00 0.3 00 
寻 4 01 0.11011 0.2| 010 
4 0.1 0100 0.T10100 - 0.11 各 和 
吕 : 0.06 01010 01L01 


耳 


01011 









到 有 


(7.4-1) 


2 一 0.973 - 









全 4 
0.3 


1 
00 
01 





0.6 站 
- 04 1 


图 7.4-2 ”起 夫 受 码 的 分 配 过 程 


霍 夫 曼 编 码 过 程 为 一 组 符号 按 概率 产生 最 佳 编 码 ， 但 须 满 足 …- 次 将 一 个 符号 编码 的 条 件 
限制 。 在 代码 码 字 产 生 后 ， 解 码 时 只 需 借助 简单 的 查 表 便 可 完成 。 该 代码 本 身 是 一 个 即时 惟 
一 可 解 (instaneous and uniquety decodable) 的 区 块 码 - 称 为 区 块 码 是 因为 每 一 个 原始 符号 被 瑞 
射 为 一 固定 代码 符号 序列 ; 称 为 即时 是 因为 不 需 参 考 后 续 代 码 符号 便 可 以 将 代码 符号 字 串 中 
的 代码 码 字 解码 ; 称 为 惟一 可 解 是 因为 任何 代码 的 码 字 串 都 只 有 一 种 解码 结果 - 


@ 霍 夫 学 编码 算法 的 过 程 





笃 夫 曼 编 码 算法 必须 扫描 原始 图 像 数据 两 次 ， 其 步骤 如 下 : 


(D) 读 入 数据 并 统计 原始 数据 中 各 个 数据 出 现 的 次 数 ， 


当做 出 现 频率 、 


CC) 建立 修 夫 曼 树 。 接 着 把 稚 夫 冯 树 转 成 码 表 再 次 读 和 人 图 像 文 件 的 内 容 ， 依 码 表 转 成 码 。 


经 过 上 一 步骤 编码 的 过 程 后 ， 其 结果 有 两 种 特性 : 


1, 出 现 率 越 高 的 数据 元 素 有 较 短 的 码 ， 反 之 则 有 较 长 的 码 . 
2. 编码 的 结果 具有 惟一 的 特色 ， 即 有 惟一 前 置 码 (unique prefix )- 


整个 编码 的 详细 实现 过 程 说 明 如 下 
步骤 一 : 


首先 读 人 整个 图 像 文件 . 以 统计 每 个 图 像 数 据 出 现 的 次 数 , 以 作为 构造 餐 夫 曼 树 的 依据 . 


步骤 二 ，: 


构造 玲 夫 曼 树 。 起 夫 曼 树 的 -一般 型 态 如 图 7.4-3 所 示 ， 从 图 7.4-3 中 可 以 看 出 ， 方 块 为 未 
问 节 点 ， 代 表 原 始 图 像 文件 中 曾 出 现 过 的 数 手 ， 圆 圈 则 为 内 部 节点 。 每 个 分 支 (branch) 都 补 


编 以 0 或 1 的 码 ， 因 此 阶层 数 越 少 的 话 ， 该 层 的 节点 被 编 出 


的 码 就 越 短 ， 例 如 : 阶层 严 的 节 


点 入 及 也 的 码 长 均 为 闻 位 于 阶 朗 =~ 1 的 节点 C 的 码 长 为 上 - 1， 位 于 阶层 工 的 节点 万 的 码 
长 为 1。 建立 政 夫 曼 树 是 由 底层 向 上 层 建立 ， 霍 夫 曼 树 底层 的 节点 有 最 长 的 码 ， 越 入 上层 的 


节点 ， 瑟 的 码 越 短 - 所 以 一 开始 必须 找 出 概率 较 小 的 数据 当 
夫 曼 树 可 以 分 为 以 下 几 个 子 步骤 来 形成 ， 





成 节点 放 人 霍 夫 曼 树 中 。 建立 雹 
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子 步骤 1: 将 原始 图 像 数据 内 容 中 每 个 出 现 过 的 数据 元 素 当 成 末端 节点 . 形成 节点 集合 . 
并 将 每 今世 点 的 出 现 概 率 当成 该 节点 的 权重 。 
子 步 又 2， 从 节点 集合 中 找 出 权重 最 小 的 两 个 节点 与 素 


子 步 又 3: 将 王 与 了 的 权重 相 加 、 作 为 新 节点 丈 的 权重 ， 并 在 节点 集合 中 移 除 臣 与 了 
节点 ,加 人 于 节点 。 


子 步 又 4: 重复 2 与 3 的 子 步骤 直到 节点 集合 只 剩 下 一 个 节点 为 止 (此 节点 为 根 节点 )-。 


了 中层 上 -1 


入 层 = 





图 7.4-3 均 夫 姑 树 的 一 般 昏 态 
六 骏 三 : 


建立 码 表 ， 如 图 7.4 - 4 所 示 。 傻 设 有 ae ，…es 共 六 个 8 位 的 像素 ， 旦 其 出 现 的 次 数 分 
蓝 为 10,.40,6,10.4 及 30， 共计 100 次 ， 





图 7.4-4 码 袁 
接 下 来 把 办 夫 曼 树 转 成 码 表 。 先 把 图 中 每 一 个 未 端 节 点 改写 成 对 应 的 数据 ， 每 个 非 未 上端 
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的 节点 有 左右 两 个 节点 分 村 .编码 的 原则 为 : 从 根 节点 开始 ， 向 左 填 0， 向 右 填 1， 一直 填 到 
末端 节点 为 止 ， 这 个 操作 称 为 树 的 追踪 。 每 个 数据 的 码 就 是 根 节点 到 末端 节点 的 分 枝 上 的 
码 ， 如 图 7.4-$ 所 示 。 从 图 中 可 以 看 出 ， 出 现 率 高 的 编 以 较 短 的 码 ， 出 现 率 低 的 则 编 较 长 的 
码 。 整个 码 表 只 有 两 栏 ， 数据 与 码 ， 供 给 下 一 步 双 查 表 . 











力 7.4-5 树 的 追踪 


步骤 四 ; 

此 步骤 为 查 表 写 人 代码 - 首先 重新 读 人 原始 数据 内 容 . 依 读 人 数据 得 出 其 在 码 表 中 对 应 
的 码 ， 写 至 输出 文件 ， 接 着 重复 查 表 与 写 人 的 操作 ， 直 到 污 和 人 EOF 为 止 、 依 步骤 三 所 得 的 网 
表 所 示 的 码 表 将 遍 始 的 数据 编码 ， 编 码 后 数据 的 长 度 为 3x10+ lx40+ Sx6+4x10+5x4L 
2x30=220 位 。 原 本 al 至 sa 各 要 用 8 位 表示 ， 故 共 需 要 8x100 = 800 位 ， 由 此 可 见 所 节省 的 
位 数 相当 可 观 。 


@ 自 游程 长 度 编码 


游程 长 度 编码 (runa length encoding, RLE) 是 一 种 既 简单 又 快速 的 压缩 方法 ， 特 别 适 合用 
在 如 小 画家 之 类 的 绘图 软件 所 产生 的 图 像 文件 , 通常 会 有 2 -- 3 倍 的 压 第 率 , 因此 许多 绘图 软 
件 都 采用 此 种 压 纳 方法 . 此 外 ，RLE 也 是 传真 机 压缩 编码 标准 所 采用 的 概念 。 

游程 长 度 编码 的 概念 是 将 一 连 串 重复 的 数据 用 两 个 字 节 (byte) 表示 ， 第 一 -个 字 节 代表 该 
字 串 的 长 度 (重复 次 数 )]， 第 二 个 字 节 才 是 数据 、 如 表 7.4-1 所 示 ， 诛 始 数据 为 17 个 字 节 ， 经 
压缩 编码 成 12 个 字 节 ， 故 省 掉 了 5 个 字 节 . 


表 7.4-1 游程 长 度 编码 的 例子 














原始 数据 妈 1 全 1 E] 研 | 红 1 
| | 








编 友 581 


由 上 面 的 例子 中 可 明显 看 出 只 有 当 重复 的 次 数 大 于 2 时 ， 才 会 有 数据 压缩 的 效果 、 若 重 
复 次 数 恰好 等 于 2， 则 没有 数据 压缩 的 效果 ， 但 也 没有 膨胀 。 比 较 不 好 的 状况 是 ， 重 复 的 次 
数 为 1 ( 亦 即 没有 重复 )， 则 乓 缩 后 反而 会 比 原始 的 数据 多 出 一 个 字 节 ， 亦 即 有 了 膨胀 的 现象 . 
在 最 坏 的 情况 下 ， 原 始 数 据 中 没有 任何 相 邻 的 两 个 字 节 的 值 相同 ， 此 时 以 游程 长 度 编码 压缩 








第 七 章 图像 压 缩 -153 - 


后 的 结果 会 使 数据 量 膨胀 成 原来 的 商 倍 大 ! 这 是 游程 长 度 编 码 最 大 的 缺点 ， 因 此 有 人 提出 几 
个 改进 的 方法 。 


和 了 CX 文件 的 压缩 法 

PCX 文件 是 PC PaintBmsh 软件 所 产生 的 图 形 文 件 ， 其 图 形 压 缩 的 方法 就 称 为 PCX 的 
RLE， 基 本 上 它 是 由 上 述 游程 长 度 编 码 的 概念 改进 而 来 的 。 其 改进 重点 在 于 编码 时 ， 考 砸 到 
重复 次 数 为 1 的 数据 ， 则 原封 不 动 输出 该 字 节 ， 而 当 重 复 次 数 大 于 1 时 ， 则 以 芮 个 字 节 米 表 
孙 ， 其 中 前 一 个 字 节 为 重复 次 数 如 上 c0h (也 就 是 bity 与 bit6 均 设 为 1) ， 后 一 个 字 节 才 是 数 
据 ， 如 表 7.4-2 所 示 。 由 表 中 可 知 编码 后 只 用 掉 11 个 字 节 ， 比 先前 基本 的 RLE 又 省 了 一 个 
字 节 。 以 上 为 压缩 的 编码 过 程 ， 解 压缩 的 解码 过 程 则 可 参考 图 7.4-6 的 流程 图 . 

表 7.4-2 PCX 的 RLE 压缩 法 


原始 煞 据 他 1 妇 1 站 | 好 1 如 丰 2 个 吕 3 如 4 吕 4 好 4 他 5 全 全 贡 胡 


编 公 csal gc2aa 芭 c3aa cd c2ak 


读 一 个 字 节 的 数据 
































是 否 bit7 与 bit6 
等 于 1? 






Len 4 bitg ~ bitb 中 的 熬 据 
Data 4- 读 - 一 个 字 节 数据 
将 Data 重复 输出 Len 次 






图 7.4-6 PCX 的 PRLE 解压 缩 法 


因为 PCX 的 RLE 使 用 6 位 来 表示 重复 的 次 数 、 而 6 位 所 能 表示 的 最 大 值 为 64， 因 此 若 
重复 次 数 超过 63， 则 该 笔 数据 就 必须 用 4 个 字 节 或 更 多 的 字 节 来 表示 , 例如 有 128 个 连续 的 
a， 则 要 用 6 个 字 节 表示 成 企 z 华 ac2a: 

另外 ， 还 有 一 种 要 考 岂 的 情况 是 当 重 复 次 数 为 1， 且 该 数据 的 值 又 大 于 e0h 时 。 此 时 必 
需 输 出 两 个 字 节 ， 前 一 个 为 clh (表示 重复 一 次 )， 第 二 个 才 是 数据 本 身 ， 这 是 PCX 的 RELE 
的 缺点 。 . 


@ CUT 文件 的 压缩 法 


Dr Halo 给 图 软件 也 是 采用 以 RLE 为 基础 的 方法 来 做 压缩 ， 因 其 图 形 文件 以 CUT 为 后 
缀 ,所 以 也 称 为 CUT 文件 。 表 7.4-3 显示 一 个 CUT 文件 压缩 的 例子 。 
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囊 7.4-3 CUT 文件 压 编 的 例子 


全 1 在 | 丰 ] 在 | 如 1 全 3 本 3 委 4 酝 1 四 2 人 4 加 








836i 3 四 罗 好 araz a4 66 


此 处 连续 出 现 的 数据 仍 用 两 个 字 节 来 表示 前 一 个 代表 重复 次 数 加 上 80h ( 亦 即 bity 设 为 
D， 后 一 个 字 节 才 是 数据 。 对 于 不 重复 的 数据 将 其 收集 束 串 ， 并 在 最 前 面 加 上 一 个 字 节 ， 此 字 
节 记 录 其 后 共有 才 少 个 字 节 是 不 重复 的 数据 。 整 个 CUT 文件 解压 缩 的 程序 如 图 7.4-7 所 示 。 








是 否 bit7 与 Len 
等 于 i? 







Len :一 bits -bit 中 的 数据 
Data “- 读 一 个 字 节 数据 


输出 数据 Len 次 


图 7.4-7 CUT 广 件 的 解压 缩 流 程 








CUT 文 件 的 RLE 较 PCX 文件 的 RLE 为 优 , 这 是 因为 前 者 只 使 用 一 位 来 辨别 是 否 重 复 ， 


而 后 者 要 用 两 位 。 


7.5 有 损 压 缩 








所 谓 有 把 (lossy) 压缩 是 指 带 有 失真 的 压缩 ， 在 信息 理论 中 也 称 为 糖 秆 缩 fentrepy 
comhression)j。 考虑 有 损 压 缩 的 一 个 简单 例子 : 在 监测 取样 值 时 只 有 当 取 样 值 超过 基 个 预 设 的 


临界 值 时 ， 才 传送 数据 。 如 果 这 样 的 情况 愈 不 常 出 现 . 则 可 以 实现 信号 空间 的 有 





缩 也 会 意 大 ， 


但 在 此 同时 ， 实 际 的 原始 采样 值 就 无 法 精确 地 恢复 ， 亦 即 有 信息 损耗 。 以 下 是 有 损 压 缩 的 基 


本 特性 ; 
1 有 元 余 性 就 可 以 太 缩 。 
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2. 压 绒 只 能 在 一 定 限 度 之 内 可 道 (恢复 )。 

3. 超过 此 限度 ， 必 然 带 来 失真 。 

4. 允许 的 失真 越 大 ， 压 缩 的 比例 也 可 以 越 大。 

实现 有 损 压 缩 主要 有 两 大 方法 : 特征 提取 和 量化 方法 ， 如 图 7.5-1 所 示 。 特 征 提 取 的 典 
型 例子 如 指纹 的 模式 识别 : 一 旦 提取 出 足以 有 效 代 表 和 区 分 不 同人 指纹 的 有 效 参 数 ， 便 可 用 
其 取代 原始 指纹 数据 。 有 关 特 征 提取 部 分 我 们 将 在 第 十 章 加 以 讨论 .对 于 实际 压缩 技术 的 应 
用 而 言 . 量化 是 更 为 通用 的 有 损 压 缩 技术 。 除 了 对 无 记忆 (memoryless) 信和 叶 的 单一 样本 做 所 
谓 的 无 记忆 量化 外 ， 也 可 以 将 有 记忆 信号 的 多 个 相关 样本 映射 到 不 同 空间 ， 去 除 原始 数据 中 
的 相关 性 后 再 做 量化 处 理 。 本 章 在 后 面 的 讨论 中 均 是 以 这 方面 为 重点 ， 并 分 别 以 国际 图 像 压 
缩 标 准 正 EG 与 小 波 变换 作为 实例 说 明 . 





图 7.5-1 有 执 压缩 技术 的 简单 分 类 


7.6 _ 图像 压 缩 标准 了 PEG 


JPEG 是 目前 国际 标准 组 织 所 订 的 图 像 压 缩 标 准 ， 其 特性 如 下 : 

1，、 有 PEG 基本 上 是 一 种 有 损 压 缩 技术 ， 不 过 可 以 做 到 有 限度 的 失真 而 使 眼 哺 辩 认 不 出 
来 ， 但 却 能 达到 极 大 的 压缩 量 . 

2， JPEG 所 处 理 的 图 像 内 容 并 不 限定 要 何 种 型 态 ， 从 照片 到 卡通 图 画 ， 甚 至 是 文字 的 扫 
措 图 像 都 能 够 处 理 ， 但 对 于 较 自 然 的 图 像 内 容 如 照片 , 会 有 最 好 的 效果 。 至 于 图 像 的 
色彩 也 没有 限制 ,一般 灰 度 图 像 及 全 彩 的 到 像 都 能 处 理 。 

3. 使 用 者 可 以 在 图 像 的 品质 与 压缩 比 间 选 一 折衷 点 。 由 于 图 像 的 品 攻 和 压缩 比 是 相对 
的 ， 正 缩 比 越 大 品质 自然 越 差 。 有 些 图 像 是 供 浏 览 用 的 ， 品 质 较 差 也 无 所 谓 ， 因 此 可 
以 指定 较 高 的 压缩 比 。 如 果 要 求 较 好 的 品质， 可 以 指定 较 低 的 压缩 比 。 
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4. JPESG 提供 四 种 压缩 方式 - 最 常用 的 是 循 亩 模式 ， 久 像 由 左 至 右 ， 由 工 至 二 循 译 处 理 . 
第 二 种 是 级 进 模式 ， 当 图 像 数 据 处 理 很 慢 时 ， 人 鲍 如 通过 网 络 传送 ， 可 以 先 传 一 个 模 精 
图 像 ， 再 渐渐 使 贸 像 祖 晰 。 第 三 种 是 以 不 失真 的 方式 压缩 罚 像 ， 但 这 种 方式 很 少 被 使 
用 - 第 四 种 则 是 阶层 式 的 压缩 ， 将 图 像 以 多 重 解析 度 来 压缩 ,使 其 可 以 被 用 在 较 低 解 
析 度 下 而 不 需要 将 整个 图 像 解 压缩 。 

接 王 来 我 们 探讨 卫 EG 的 循序 模式 的 压缩 原理 


e@ JPEG 的 压缩 与 解压 缩 过 程 


图 7.6-1 是 JPEG 的 压缩 过 程 。 在 压缩 时 是 先 把 图 像 分 割 成 8 x 8 的 抉 来 处 理 ， 不 足 的 部 
分 则 以 最 右边 或 最 前 面 的 点 延伸 为 8 的 倍数 . 解压 缩 的 过 程 只 是 压缩 的 道 向 过 程 ， 因 此 ， 此 
处 只 着 重 压 缩 部 分 - 


和 
下。 
量化 表 编码 天 


图 7.6-1 JPEG 的 压缩 过 程 





多 离散 余弦 变换 


第 四 章 中 所 提 到 的 离散 余 纱 变 搞 (discret cosine transfborm, DCT)， 是 整个 PEG 压缩 技术 
的 精髓 所 在 。 其 一 维 的 定义 为 


坟 ， 了 
F(D= 一 > 让 oj 2 ， el -起 0 (7.6-1) 
一 1， 下 和 站 





其 中 Am 为 输 和 数据， 天 ( 昌 为 变换 的 输出 ，0 和 交大 所 -1。 

我 们 举例 说 明 DCT 的 效应 。 在 表 7.6-1 中 有 三 组 数据 ,每 组 各 有 8 个 数据 (W= 8) 及 其 经 
过 DCT 变换 后 各 频率 的 系数 。 在 第 一 组 的 数据 中 ,由 于 数据 间 没 有 变化 . 因此 变换 后 只 有 直 
流 系数 DPC， 其 他 的 交流 系数 AC 全 为 0. 第 二 组 数据 间 的 变化 很 小 ， 振 幅 不 大 ,因此 AC 值 
也 都 很 小 。 第 三 组 的 数据 则 因为 变动 比较 大 ， 故 有 较 大 的 AC 值 。 


表 7.6-1 DCT 效应 的 例子 
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DCT 在 图 像 球 缩 中 可 扮演 何 种 角色 ” 首先 观察 一 些 具有 所 谓 连 续 色 调 (continuous tone) 
的 自然 图 像 (例如 照片 )， 我 们 将 会 发 现 图 像 上 大 多 数 局 部 区 域内 的 颜色 或 灰 度 变化 都 不 大 。 
由 表 7.6-1 的 例子 可 知 ， 若 以 DCT 对 这 些 图 像 数 据 分 析 ， 就 会 发 现 较 高 频 的 AC 值 都 很 小 - 
由 于 人 的 眼睛 对 低频 部 分 比 对 高 频 的 部 分 要 敏感 些 ， 因 此 若 去 除 高 频 的 部 分 ， 则 在 围 像 还 原 
时 ， 只 产生 不 易 辨 认 出 来 的 些许 误差 。 换 言 之 ， 去 掉 视觉 上 较 不 重要 的 高 频 部 分 ， 对 图 像 品 
质 影 响 不 大 ， 却 能 提高 压缩 比 。 

JPEG 使 用 二 维 的 第 二 类 DCT, 处 理 一 个 8x8 的 二 维 答 阵 数据 ， 因 此 变换 成 为 到 个 系数 
(1 个 DC 与 玖 个 AC， 称 为 顺 向 的 DCT (DCT 正 变 换 ) (forward DCT 或 FDCT ) 姑 向 的 
DCT (DCT 反 变换 ) (inverse DCT 或 IDCT) 则 是 将 此 妈 个 系数 还 原 为 8x8 的 数据 ， 用 于 解压 
缩 时 。 其 公式 如 下 
FDCT 





ms 有 =- 站 16 


IDCT 





了 了 朵 Y 
mm=4 立 2 (ct hicos em 十 ]) 丰 有 一 -一 一 co sz 二 LU f7.6-3] 


ko 1 16 16 


FDCT 产生 刀 个 系数 后 ,接着 对 其 扫描 ，、 其 扫 措 顺序 则 如 图 7.6-2 所 示 。 由 于 其 扫 摘 形 
状 有 如 争 齿 一 般 ， 故 称 之 为 Zigzag 扫描 ， 其 中 第 一 个 扫描 的 DC 值 位 于 左上 角 。 


上 CT 上 CC 


六 DC 


厂 息 人 
FDCT 
一 一 一 一 和 

8 和 
IPPCT 


rm 四 : 图 像 数据 FED， DCT 系数 








玫 7.6-2 FDCT 与 1DCT 的 关系 


急 彩色 赎 像 压缩 

卫 EG 可 以 适用 的 图 像 种 类 包括 灰 度 与 全 彩色 的 图 像 . 如 5.4-1 节 所 述 , 红 . 绿 . 蓝 (RGB) 
是 最 简易 的 彩色 模型 ， 适 合 监 视 器 兰 个 电子 检 的 颜色 显示 。 但 对 我 们 的 感官 视觉 而 言 ， 这 种 
模型 未 必 是 最 自然 的 表现 方式 。 这 是 因为 和 我 们 的 眼 畴 比较 有 直接 关系 的 是 色彩 的 亮度 及 饼 
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艳 度 等 ,所 以 JPEG 舍 RGB 而 采取 YCrCb 的 色彩 模型 ， 其 中 Y 代表 亮度 (uminance)， 而 Cr 
与 Cb 则 称 为 色 度 (chrominancej。 一 般 电视 信号 也 是 采用 这 种 色彩 借 型 . 这 可 从 电视 上 的 控 
制 键 看 出 。RGB 与 YCrCb 这 二 种 模型 可 仿 下 面 的 方程 式 豆 相 变换 


了 = 0.299R+0.587G +0.114B 
Cr=( 及 -站 11.402 (7.6-4) 
CD = (一 节 71.772 


灵 = 了 十 1.402C7 
好 = 了 一 0344Cp 一 0.714Cr (7.6-9) 
已 = 了 十 1.772(D 


一 般 而 言及 、C、 六 都 是 以 8 个 位 来 表示 ， 亦 即 其 数值 范围 在 0 到 255 之 闻 ， 在 变换 成 了 、 
弛 、CD 后 ,了 的 范围 仍然 是 0 到 255， 但 入、 则 是 - 128 127。 因 此 在 取 FDCT 之 前 ， 先 将 
了 减 去 128， 使 其 范围 也 落 在 - i28 到 127 之 问 ， 一 致 的 动态 范围 对 后 续 处 理 较为 方便 、--- 个 彩 
色 图 像 有 了 、Cr、 咏 三 个 色彩 成 分 ， 而 灰 度 图 像 则 只 有 亮度 ， 也 就 是 只 有 Y 一 个 名 彩 成 分 事 
实 上 隐 EG 并 不 限制 图 像 有 多 少 个 色彩 成 分 ， 查 一 般 的 应 用 上 只 有 这 两 种 色彩 成 分 的 组 合 。 

由 于 下 EG 是 凡 …- 个 8x8 的 块 为 单位 来 处 理 ， 因 此 对 于 每 种 色彩 成 分 ， 都 要 切割 成 不 相 重 
普 的 8xg 块 . 再 分 别 作 FDCT 的 处 理 - 由 于 人 的 眼睛 对 于 了 C、cC 三 种 成 分 的 敏感 度 不 同 ， 
例如 眼睛 对 于 亮度 了 的 感觉 会 比 Cr、 地 来 的 敏锐 ， 所 以 这 三 个 成 分 在 神 觉 上 的 重要 性 并 不 相 
间 。 由 于 Cr 与 C 的 重要 人 性 比较 狼 ， 可 以 容忍 的 误差 比较 大 ， 因 此 为 了 获得 较 大 的 压缩 比 ， 对 
于 Cr 与 C 的 数据 可 以 每 两 个 点 只 取 一 点 来 处 理 ， 这 种 减少 数据 量 的 作法 称 为 缩减 取样 
(subsamplingj。 如 图 7.6-3 所 示 , 每 16x8 的 块 就 可 以 取 其 中 一 半 成 为 一 个 8xg 块 ; 至 于 了 则 不 
作 缩 减 取样 ,否则 会 影响 图 像 的 品质 . 形成 缩减 取样 的 方式 有 两 种 : 对 于 一 个 16x16 的 块 而 言 ， 
了 取 由 个 DCT 块 ，Cr、C2 则 各 到 两 个 DCT 块 ， 这 种 格式 称 为 YUV422; 如 果 好 、C 每 四 个 
点 才 取 样 一 点 则 称 为 YUV411 的 格式 ,因为 每 16x16 的 扎 才 取样 成 一 个 PCT 块 . 


出 Mr2 





医 7.6-3 编 减 取样 


至 于 取样 方法 则 有 缩减 取样 及 扩 增 取样 (upsamplingj)， 如 图 7.6-4 所 示 。 此 钼 的 缩减 到 样 
是 指 要 取样 的 该 点 和 其 左右 2 点 以 2 :1 : 1 的 比重 加 起 来 。 当 数据 要 还 原 时 ， 则 在 每 两 个 取 
样 点 间 加 人 一 点 ， 其 值 为 两 个 取样 点 的 中 间 值 ， 这 个 过 程 就 是 扩 增 取样 。 缩 减 到 样 可 减少 很 
大 的 数据 量 ， 达到 更 高 的 压缩 比 。 以 YUV422 而 言 ， 就 使 数据 减少 了 13， 而 YUV411 的 方 
式 则 使 数据 减少 一 半 。 
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-回国 加 由 器 


| 缩 碱 取样 


刀 = 人 +28+ckd ,=te+2d+re4 





二 L 扩 增 取样 


品 回 口 - 


C= 人 0 
7.6-4 缩 基 取样 与 扩 增 取样 的 方法 


旬 量 化 

量化 是 许多 压缩 技术 中 不 可 或 缺 的 一 环 : 由 于 许多 经 处 理 的 数据 是 连续 性 的 、 例 区 在 
FDCT 后 所 产生 的 系数 值 都 是 带 有 小 数 点 的 浮 点 数 . 必须 要 和 量化 才 真 正 可 达到 压缩 的 效果 . 
卫 EG 提供 两 个 PCT 系数 的 其 化 表 ， 如 图 7.6-5， 每 个 表 含 8x8&8 具 64 个 值 对 应 伺 个 系数 . 量 
化 的 方式 就 是 将 每 个 系数 秦 以 表 中 相对 应 的 值 ， 取 其 最 接近 的 整数 











已 过 站 = cd 人 间 (7.6-6) 








234 叭 
嫩 后 
始 多 
奴 邮 
拆 级 
只 姑 
吕 对 
吕 把 


Lutminancse 的 量化 表 Chrominance 的 时 化 表 
图 7.6-5 ”JPEG 所 提供 的 量化 表 


当 解 压缩 时 ， 则 将 系数 乘 上 量化 表 的 值 。 可 想 而 知 这 必定 会 产生 误差 ， 因此 景 化 表 的 值 
会 影响 图 像 品质 及 压缩 比 。 由 于 亮度 与 色 度 的 重要 性 不 同 ， 因 此 各 有 不 同 的 量化 表 卫 EG 
提供 的 表 是 经 过 大 量 图 像 测 试 的 实验 结果 ， 对 于 大 部 分 的 图 像 都 有 很 好 的 效 昌 .从 表 中 可 以 
发 现 ， 高 频 系 数 所 对 应 的 量化 值 较 大 , 其 首 的 就 是 要 把 高 频 的 部 分 变 成 几乎 都 是 0 或 接近 0 
这 对 后 面 以 RLE 为 基础 的 编码 会 有 很 大 的 帮助 ， 

JPEG 可以 在 压缩 比 与 图 像 品 质 间作 一 个 售 ， 其 方法 就 证 改变 量化 表 的 值 。 葬 如 如 果 
把 量化 表 的 值 者 放大 一 倍 ， 将 有 更 多 的 系数 被 量化 成 0. 而 达到 更 高 的 压 迪 比 、 但 品质 -- 般 
而 言 也 会 降低 。 


曙 编 码 
当 DCT 的 系数 量化 之 后 ， 就 要 将 这 乒 个 系数 编码 。 编 码 的 方式 可 以 用 算术 编码 法 
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(arithmetic coding) 或 使 用 替 失 曼 编 码 法 ， 昌 然 前 者 的 效果 会 好 一 点 ， 但 一 般 都 是 采用 较 简 单 
的 后 者 - 对 每 个 DCT 块 而 言 ， 首先 将 DC 的 俏 减 掉 上 一 个 PCT 据 的 PC 值 ， 这 个 差 值 通常 
不 大 . 国 为 相 邻 DCT 抉 的 颜色 或 灰 度 变化 不 大 。 以 图 7.6-6 为 例 ，DC 差 值 为 5. 这 个 数字 将 
被 表 成 (SS)，VV,， 其 中 的 VV 表示 该 差 值 , 即 VV = 5 而 93 则 表示 要 用 多 少 位 来 表示 该 值 . 
VWY 是 以 可 变 长 度 的 整数 (variable length integer VILD 来 表 示 ,由 于 5 表示 为 二 进位 的 101 ， 
只 要 用 3 位 来 表示 , 因此 $$ = 3. 表 7.6-2 列 出 不 同 范围 的 整数 所 需 的 位 数目 . 例如 -3、- 2、 
2、3 四 个 数字 都 只 要 用 2 位 就 可 以 表示 ， 分 别 表示 为 00、01、10，11. 








局 二 
总 
人 
和 
六 
司 区 





图 7.6-6 DCT 系数 的 编码 
表 7.6-2 VLI 的 大 小 


kt 一 


了 
站 
5 
各 
7 
8 
9 


1 


-2047...-1024 1024...2047 


一 一 





对 于 Ac 的 部 分 ， 则 依照 Zigzag 顺序 由 AC1L 到 AC63， 找 到 每 一 个 非 零 的 AC 值 ， 就 将 
其 表示 成 QWNASS)VV， 其 中 NN 表示 该 AC 值 前 0 的 个 数 ， 而 SS 与 VV 则 与 先前 的 定义 --- 
样 , 但 这 里 的 SS 不 得 为 0. 例如 图 7.6-6 中 的 AcC3 = -2. 在 其 前 曾 的 AC1 和 AC2 均 为 零 . 
故 表示 成 2/2}, -2。 当 NN 超过 15 时 ， 则 以 一 个 (15/0) 来 表示 有 16 个 连续 的 霍 ， 例 如 图 中 
的 AC21 = 1、 原 本 应 表示 为 (i771)1， 现 在 则 表示 成 (1S0) (LU1),1。 另外 若 有 一 串 的 零 延 伸 到 
AC63， 不 论 堆 的 个 数 有 多少 , 一 律 都 用 一 个 {00) 来 代表 块 编码 结束 恨 据 上 述 法 则 . 图 7.6-6 
的 系数 可 表示 或 : 人 9),5 022)，- 215 0 (7 TOO. 

这 些 符号 最 后 均 以 性 夫 卸 编码 得 到 实际 的 压缩 数据 。 了 PEG 提供 数 个 赴 夫 曼 编 码 表 ， 如 
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表 7.6-3 中 所 列 的 为 其 中 一 部 分 .这些 表 是 根据 许多 了 图像 测试 得 来 的 平均 结果 ， 对 大 多 数 的 
图 像 而 言 者 有 不 错 的 效果 。 编码 表 一 般 有 四 个 ， 分 别 给 亮度 的 DC 与 AC， 凡 及 色 度 的 DC 与 
AC 使 用 ,这 基因 为 量化 后 的 亮度 与 色 度 系数 的 概率 分 布 不 同 ， 为 了 得 到 较 好 的 效果 ,因此 
使 用 不 同 的 表 。 编 码 时 ， 表 示 DPC 的 ($8) 应 该 对 照 DC 编码 表 的 (SS) 而 得 到 对 应 的 码 ; 同样 
的 ,表示 AC 的 (NNASS) 则 对 照 AC 编码 表 的 (NVSS) 而 得 到 对 应 的 码 。 由 于 NN 与 SS 都 不 超 
过 15， 因 此 可 以 各 用 4 位 组 成 一 个 索引 值 ， 至 于 VV 的 部 分 则 是 以 SS 位 来 表示 ， 如 果 VV 
大 于 零 则 直接 取 其 最 低 的 SS 位 ， 着 小 于 零 则 记录 VV - 1 的 最 低 S3 位 , 若是 VYV 等 于 堆 则 
不 加 以 记录 。 

表 7.6-3 JPEG 所 提供 的 几 个 过 夫 受 编码 表 

(1.3 【22) -2 【1S20) (1 的) 

= 一 >100 1]91 1111100018111LLLUIDOILIULOG11010 
亮度 与 色 度 的 DC 值 亮度 与 色 度 的 AC 值 

亮度 三 色 度 码 

人 的 1 1 0 
站 1 的 站 
011 总 100 
100 100 1010 
191 111 10i1L 1000 





心 


110 了 1 

1110 111110 
11110 111i110 
111110 11111111 
11i111 11111111 他 
11 1 11111113D0 
111111t 111ti1Il1t11 


1 
2 
3 
4 
5 
6 
了 
名 
9 


一 呈 - 
呈 所 





11010 

1111000 

11111000 
1111110100 
tttllli0000010 
111111tt0000011 
1100 

11011 

1113001 


11i11113Lllllitbol 
113i111IItitlltLLO 


11001 

111004 
1111000 
11]1110100 
111LL101I 

上 1 下 作 
1011 

111001 

工人 于 


1itllillilllilb0i 
1111111111L11tLTI 








以 图 7.6-6 的 几 个 值 为 例 ， 假设 该 DCT 块 是 属于 亮度 的 色彩 成 分 ， 那 么 对 照 编 码 表 就 可 
以 得 到 压缩 后 的 数据 。 图 中 显示 ， 原 本 一 个 DCT 所 有 三 个 字 节 ， 压 缩 后 只 有 37 位 ， 约 为 
4.6 个 字 节 ， 故 有 约 14 倍 的 压缩 比 。 事 实 上 ， 有 许多 的 DCT 抉 在 量化 后 几乎 只 剩 下 DC， 而 
AC 全 部 为 堆 ， 此 时 压缩 比 会 更 高 

节 后 我 们 比较 一 下 RLE 与 卫 EG 的 压缩 交 果 ， 以 及 JPEG 压缩 法 在 不 同 压 缩 程 度 下 图 父 
还 原 后 的 差异 程度 。 所 采用 的 原 图 像 显示 于 图 7.6-7 中 。 
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(a) 目 然 图 像 个 ) 手 绽 图 
图 7.6-7 原始 图 休 


这 里 所 使 用 的 压缩 效率 ， 是 指 被 压缩 掉 的 大 小 除 以 原本 大 小 的 百分比 ， 因 此 百分比 愈 高 
代表 压缩 效能 剑 佳 。 由 表 7.6-4 中 显示 ，RLE 压缩 法 应 用 在 手绘 图 这 种 较 简 单 的 图 像 上 时 ， 
会 有 较 佳 的 压缩 获 率 ， 而 下 EG 则 对 两 者 都 有 非常 好 的 压缩 效果 。 


表 7.6-4 比较 RLE 及 JPEG 的 压缩 效率 


344,785 128,592 
318,720(7.59%0) 23,380(8190) 
39.819(88%6) 8,695(9190] 
JPEGUD) 27.645(9290) 6,751(94%4) 
单位 : 字 节 





图 7.6-8 及 图 7.6-9 显示 且 EG 分 别 采 取 压 缩 参 数 10 及 20 后 ,图像 还 原 的 结果 。 在 手绘 
图 艾 像 中 , 由 于 有 较 清 楚 的 边缘 存在 ,所 以 在 经 过 隐 EG 压缩 后 ， 在 边缘 处 会 有 模糊 的 现象 ， 
而 这 一 缺点 在 另 一 张 自 然 图 像 上 较 不 易 察 觉 。 





(加 自然 图 像 
7.6-8 指定 压缩 参数 10 的 JPEG 压 织 还 原 结 果 
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人 自然 图 像 
图 7.6-9 指定 压缩 参数 20 的 JPEG 压缩 还 原 结果 


7.7 动态 图 像 压 缩 


7.7-1 视频 图 像 压 缩 标准 MPEG-2 


由 于 通讯 科技 的 发 展 及 超大 规模 集成 电路 技术 的 日 新 月 异 ， 使 人 类 在 生产 消费 与 休闲 如 
乐 上 有 革命 性 的 转变 。 为 了 使 每 一 终端 用 户 能 享受 通讯 服务 ， 单 以 原 有 的 通讯 媒介 是 无 法 承 
受 的 。 除 了 布 冒 宽带 光缆 以 取代 现 有 的 铜 线 回路 外 ， 降 低 数 据 量 是 解决 有 限 频 道 资源 的 有 效 
办 法 。 而 各 类 信息 中 ， 又 以 视频 图 像 所 需要 的 数据 量 最 大 ， 固 此 视频 图 像 压 缩 为 现今 媒体 通 
讯 的 关键 技术 之 一 。 从 CCITT 的 也 261 到 MREG 压缩 ,无论 是 在 画 质 、 解 析 度 、 动 作 连 续 
性 及 错误 的 遮 隆 能 力 都 有 很 大 的 进步 ,但 是 基本 上 它 并 未 满足 在 广播 或 HDTV 或 有 线 电视 等 
方面 的 应 用 需求 。 这 些 系统 不 仅 要 求 更 高 的 画 质 及 解析 度 ， 同 时 还 要 能 通过 各 种 网 络 做 不 同 
的 服务 ， 因 此 才 有 MPEG-2 标准 的 制定 。 本 节 将 探讨 国际 标准 化 的 视频 图 像 讨 缩 方法 ， 特 别 
是 MPEG-2 的 视频 图 像 编 解 码 标准 ， 


和 MEPEG-2 特性 


MPEG-2 与 MPEG-!1 的 不 同 之 处 在 于 前 者 的 语法 结构 至 少 提供 了 下 列 各 种 特征 

1. 提供 乏 行 与 隔行 的 扫描 格式 

一 般 电 视 的 信号 属于 摧 行 (interlaced) 扫描 式 ， 而 有 些 计 算 抽 上 太 视 听 器 材 属 于 腺 行 
(piogressive) 扫描 式 。MPEG-2 能 针对 隔行 式 或 逐 行 式 动 态 图 像 的 特性 获得 最 佳 的 编码 效 
果 。 

2. 提供 3 : 2 变换 功能 

这 使 得 电影 (每 秒 闻 个 画面 ) 到 电视 信号 (NTSC 每 秒 30 个 画面 ) 之 间 的 变换 有 了 直接 面 
简便 的 途径 。 
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3. 提供 移动 型 的 视窗 显示 

用 一 个 低 解析 度 的 电视 如 何 收视 高 解析 度 画 面 的 节目 ? 可 以 用 把 视窗 的 位 置 和 大 小 编 人 
位 码 流 来 解决 。 

4， 画面 品质 的 可 调度 更 大 

因为 位 率 的 弹性 加 大 了 , 节目 的 制作 者 再 充分 运用 再 利用 的 位 来 调整 画面 的 品质 . 同时 因 量 
化 窍 阵 和 量化 阶 数 的 庭 择 变化 增多 ， 因 量化 而 产生 的 误差 相对 可 以 做 得 比较 小 ， 使 品质 提高 - 

5 随机 搬 取 

一 般 所 指 的 随机 揪 到 ， 着 重 于 鱼 存 介质 上 数据 的 随机 撕 取 。 将 此 观念 用 圣 视 频 编 码 上 ， 即 
每 一 幅面 面 才能 在 规定 时 间 内 被 解码 或 撒 取 ,在 作法 上 则 是 将 编 好 友 的 位 流 切 割 成 互相 独立 的 
区 段 ， 每 一 区 段 孝 出 一 工 画面 领头 因此 可 以 独立 解码 。 这 样 的 谨 计 使 得 视频 编码 在 广播 电视 
上 的 应 用 更 为 便利 、 因 此 基本 上 使 用 者 每 变换 一 次 频道 都 等 于 是 另 一 随机 报 取 的 开始 . 

6. 高 低 复杂 度 的 解码 器 

由 于 MPEG-.2 是 向 下 兼容 , 因此 一 个 MPEG-2 解码 器 完全 可 解 任 何 MPEG-1 位 流 , 但 是 
MPEG-1 解码 顺 无 法 解 任何 MPEG-2 位 流 。 在 MPEG-2 profile 和 层次 (level 的 设计 之 下 ， 
MPEG-1 位 流 可 以 被 包含 在 低层 次 之 干 被 MPEG-2 解码 器 所 解码 。 

7. 差错 的 掩盖 

画皮 组 的 设计 虽然 可 以 把 错误 的 传播 限制 在 其 所 属 的 画面 组 内 .但 若 受 损 的 画面 是 I 画 面 ， 
则 收视 者 极 有 可 能 会 感受 到 多 至 半 秒 的 不 良 苛 而 这 是 高 价值 高 品牌 的 产品 所 不 允许 的 - MPEG-2 
利用 差错 掩 盖 位 移 向 量 来 修补 损坏 的 宏 块 ， 使 差错 的 扩散 减 至 使 收视 者 不 易 察 觉 的 程度 。 


7.7-2 MPEG-2 标准 的 岩 理 


急 MPEG-2 标准 


MPEG 委员 会 于 1988 年 成 立 ， 并 与 Expert Group for ATM Video Coding 于 1990 起 合作 
制定 出 ISOAEC 13818 国际 标 蕉 ， 也 就 是 MPEG-2 标准 。 其 中 包含: 

1.ISOAEC 13818-1 系统 

迪 部 分 定义 一 个 整合 贸 像 与 声音 的 多 工 结构 及 图 像 与 声音 同步 所 需 的 时 序 信 号 的 表示 
方法 。 在 系统 中 定义 了 两 种 数据 流 ， 传输 数据 流 (transport stream] 及 节目 数据 流 (progralin 
strearm， 其 中 传输 数据 流 主 要 应 用 在 网 络 有 线 电视 ， 蔬 目 数 据 流 则 用 于 数字 储存 媒体 ， 如 
CD-ROM。 

2. ISO /IEC i3818-2 图 像 部 分 

主要 是 定义 经 过 压缩 的 贸 像 数据 的 形式 及 解压 缩 所 需 的 过 程 : 

3.ISO 7IEC 13818-3 音效 部 分 

定义 音效 数据 讨 缩 的 编码 方式 。 

4.ISO 7IEC 13818- 4 套 容 性 

定义 出 一 系列 的 程序 以 测试 某 一 数据 疲 是 否 与 标准 相符 : 
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和 MUPEICG-2 数据 结构 


MPEG-2 图 像 数 据 结 构 共 六 层 ( 见 图 7.7-1)、 除 了 宏 块 及 块 外 其 余 各 层 都 有 独特 的 起 始 码 
加 以 辨认 。 视 频 序列 是 最 上 层 ， 内 含 数据 包括 画面 大 小 、 量 化 矩阵 及 每 秒 画 面 数目 等 ， 基 本 
上 每 一 层 均 由 标 头 (headen 及 有 关 下 一 层 的 信息 所 组 成 。 


画面 级 画面 组 
十 一通 面 


电 - 夯 面 切片 
才 一 一 宏 块 






图 7.7-1 MPEG-2 数据 结构 


在 视频 序列 之 下 就 是 所 谓 画 面 组 ， 它 使 我 们 可 以 针对 某 一 视频 序列 内 的 所 有 画面 做 随机 
存 取 . 每 一 个 画面 组 一 定 是 以 工商 面 (Lpicture) 为 开始 。 画 面 层 即 是 视频 序列 内 每 一 张 个 别 的 
着 面 。 在 MPEG-2 内 定 祥 三 种 画面 : 

工 画面 (内 部 编码 ，intracoded) 

P 画面 (预测 编码 ，predicte 赴 

B 画面 (双向 预测 编码 ，bi-directionary predicted) 

其 中 工 画面 是 参考 本 身 的 数据 来 做 编码 ; P 画 前 是 根据 过 去 的 I 画 面 来 编码 ; B 画面 则 是 参考 
前 面 及 后 面 的 [画面 或 P 画面 来 编码 。 由 于 B 画面 需要 靠 双 向 的 I 画 面 及 了 画面 来 编码 ， 所 
以 会 造成 如 图 7.7-2 般 编 码 与 播放 头 序 不 同 的 情形 . 


播放 : 
编码 ; 





7.7-2 ”一 个 视频 序列 的 组 成 
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每 一 画面 又 可 分 成 若干 个 切片 ， 每 一 个 切片 包含 若 于 个 宏 抉 ， 由 图 7.7-3 可 害 出 之 间 的 
关系 。 














图 7.7-3 画面 雪 片 (Slice) 与 宏 块 (MB) 的 关联 


每 一 个 宏 块 包含 数 个 8x8 像素 区 块 。 每 一 个 像素 由 亮度 (Y) 及 色 度 {Cb， CD 组 成 ， 和 根 
据 不 同 的 Y、Ch、cCr 比例 ， 图 7.7-4 说 明 有 所 谓 的 4:2:0、4:2;:2 及 4:4:4 三 组 。 
4:2;0 是 指针 对 四 个 像 . 利用 四 个 站 及 两 个 Cb 及 Cr (各 一 个 ) 数据 来 表示 ， 即 四 个 Y 
共用 一 个 Cb 及 Cri 4 :2 :2 即 四 个 Y 共 用 两 个 Cb 及 Cr 4:4:4 则 表示 每 一 个 立 有 一 
个 Cb、cCr。 其 中 数据 越 多 (如 4 : 4 : 和 越 适合 专业 的 图 像 工作 室 ， 因 为 它们 通常 有 较 高 品 
质 的 需求 。 





7.7-4 不 同 YUV 比例 


@ RDPEG -图像 解码 器 
图 7.7-5 是 一 个 上 典型 的 MPEG-2 图 像 解 码 器 的 应 用 环境 。 从 图 7.7-5 我 们 可 看 出 一 个 
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已 压缩 MPEG 数据 流 


陆地 /人造 卫星 
广播 或 有 线 电视 


图 7.7-5 MPEG-2 的 应 用 环境 


MPEG-2 图 像 解码 器 至 少 应 : 

(1) 与 主 处 理 器 作 沟 通 ， 接 受 经 过 分 离 的 图 像 压 缩 数 据 。 

(2) 解压 缩 。 

G) 与 存储 器 连接 ， 存 取 压 缩 / 解压 缩 过 的 图 像 数 据 。 

(4 与 视频 编码 连接 ， 提 供 解压 缩 过 的 数字 数据 给 编码 器 以 产生 模拟 的 视频 信号 ， 输 出 

至 电视 或 监视 器 。 

图 像 解 码 器 的 方块 图 , 通常 包 会 了 下 列 几 个 单元 ; 宁 内 部 微 处 理 器 ; 人 解码 器 二 反 
量化 器 ; 由 反 离 散 余 纤 变换 ; 饼 动态 补偿 ; 名 存储 器 介面 ; @) 主 处 理 器 介面 ; 佬 显示 控 
制 器 介面 。 

内 部 微 处 理 圳 为 图 像 解 码 器 的 控制 中 心 ， 它 从 外 部 的 主 处理 器 接受 命令 并 提供 目前 解码 
占 的 状态 ， 并 负责 解码 器 内 部 其 他 单元 之 间 的 同步 工作 及 解释 隐 合 在 MPEG-2 图 像 数 据 流标 
头 的 信息 ， 以 产生 必需 的 参数 及 控制 信号 给 其 他 单元 。 

MPEG-2 使 用 霍 去 曼 的 编码 方式 ， 并 在 标准 中 定义 了 两 组 对 照 表 (MPEG-1 中 只 有 一 
组 )。 霍 夫 曼 解码 冉 根 据 对 照 表 ， 将 压缩 的 数据 变换 成 一 申 游 程 长 度 编 码 。 

此 反 量 化 玲 单 元 的 主要 功能 包括 : 

吕 将 游程 长 度 编码 转 成 真正 的 码 。 如 3021221133 一 00011221333。 

人 @@ 将 变换 出 的 数据 用 两 种 不 同 的 扫描 方式 组 成 一 个 8 x8 的 和 矩阵。 如 图 7.7.6 所 示 ， 其 

中 们 是 Z 字 型 扫描 、 个 ) 是 交错 型 (altemativey 扫描 ， 而 在 MPEG-] 中 只 定 广 了 一 种 扫 
描 方 式 。 

声 执行 DPCM 以 求 得 此 一 8 xg 的 DC 系数 (位 于 8x8 和 矩阵 左上 角 的 系数 )。 

地 将 此 一 8 x8 矩阵 (左上 角 DC 除外 ) 卫 上 一 个 量化 因子 以 得 到 一 个 还 原 的 反 离 散 余 蓄 

变换 系数 矩阵 。 
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号 反 高 散 余弦 变换 : 将 还 原 的 系数 年 阵 做 处 理 。 













了 | 证 证 
可 太 惨 吧 了 态 硬 
一 
中 到 态 取 马 成 也 而 
性 
到 治 取 也 太 到 态 天 
AAA 
千 1 和 1 生生 


介 Z 字 弄 





1 


本 天 了 了 4 
方刚 人 广 纪 


国人 
六 


可 有 
十 放 
和 
DEL 


(b) 交错 型 


7.7-6 的 描 方式 
在 前 面 提 过 有 所 谓 的 P- 面 面 及 B- 商 面 , 基本 上 ，, 这 类 画面 并 不 是 真正 根据 自己 画面 的 内 


容 加 以 压缩 而 是 在 过 去 或 未 来 的 画面 中 去 找寻 一 个 与 它 相 符 的 宏 块 ， 然 后 算出 运动 向 量 (从 
目前 画面 中 和 运动 到 过 去 (未 来 ) 相符 的 宏 块 所 需 的 向 量 )， 如 图 7.7-7 所 了 未。 运动 补偿 即 是 根据 


运动 向 量 来 计算 出 真正 的 宏 块 。 


其 余 如 存储 器 介面 、 主 处 理 器 介面 、 显 示 控 制 器 介面 则 视 各 个 广 商 设计 有 所 不 同 ， 但 是 
大 同 小 异 , 主 存储 器 介面 是 前 大 部 分 使 用 IBM 的 Powef PC、Intel 386EX、Motorola 68K 、……… 
显示 控制 器 介面 则 有 YUV 输出 及 GRB 输出 两 种 介面 - 





加 


前 画面 搜寻 视窗 







图 7.7-7 区 块 对 比 运动 补偿 


7.8 ”以 小 波 变换 压缩 的 实例 


7.8-1 导 论 


本 节 所 使 用 的 压缩 方法 是 将 图 僚 小 变 换 所 得 的 小 波 系数 做 向 量 量 化 ， 同 时 使 用 金字 堵 
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型 多 解析 度 结构 。 以 小 波 变 搞 为 基础 的 多 解析 度 树 状 分 解 如 图 7.8-1 所 示 。 其 中 工 与 分 别 
代表 沿 图 像 的 行 或 列 取 低 与 高 频 成 分 的 运算 。 





男 7.8-1 将 图 像 作 二 层 分 解 示意 图 


将 小 波 变换 应用 到 图 像 上 并 未 降低 欲 压 缩 数 据 的 数据 量 。 真 正 的 压缩 是 发 生 在 将 系数 量 
化 时 。 量化 可 大 致 分 成 向 量 量 化 fvector quantizatiom, VQ) 与 纯 量 量化 (scalar quattization, SQ) 
两 种 ， 在 本 书 第 三 章 中 曾 提 到 ， 此 处 讨论 重点 则 在 于 如 何 与 小 波 系数 结合 。 


7.8-2 量 化 


@ 向 量 量化 准则 
小 波 变 换 与 向 量 量化 的 结合 ， 如 图 7.8-2 所 示 ， 其 中 的 铬 解析 码 本 是 指 对 不 局 阶层 或 类 





型 的 小 流 系数 分 别 给 向 量 维度 或 碍 本 大 小 可 能 不 同 的 向 量 量化 最 常用 的 码 本 设计 方法 是 33 
节 所 介绍 的 LBG 算法 ， 其 中 初始 码 本 4 的 选择 可 用 以 下 的 方式 。 


编 取 器 解码 器 






编码 后 的 信 
取 。 


多 解析 度 码 本 | 多 解析 度 码 本 


图 7.8-2 编码 / 解 玛 流程 方块 图 
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(0) 起 始 状 态 : 设 M=1， 定 义 4 为 全 部 输 和 人 向量 的 中 心 点 。 

人 令 含 好 个 向 量 { 革 =12,…, 好 的 码 向 量 为 机 (8M) ， 接 着 将 每 个 向 量 态 分 割 成 两 个 
近似 抑 向 量 六 +e 和 也 -E, 下 处 E 为 一 固定 扰动 向 量 . { 了 +E -eei=12 村 的 
集合 4 有 2M 个 向 量 。 用 2 邓 取 代打 。 

人 令 4M)= MD。 亲 与 下 是 否 相 等 ”如 果 是 . 则 停止 , 此 时 半 即 为 所 求 。 如 果 不 是 , 
在 40d) 上 执行 好 阶 量化 器 的 LBG 算法 并 县 返回 子 步 又 (1)- 


@ 与 纯 量 量 化 的 比较 


比较 纯 量 量化 和 向 量 量化 时 应 考虑 二 方面 : 压缩 比 的 达成 及 图 像 品 质 ， 表 7.8-1 比较 了 
sSQ 和 VQ 的 差异。 在 SQ 方面 ， 假 设 要 量化 的 取样 点 有 Gaussian 、Laplacian 和 Gamma 困 数 
概率 密度 分 布 ， 从 对 应 的 Lloyd-Max 量化 器 中 选 出 结果 最 好 的 列 于 表 中 。 一般 而 言 ，Gamma 
函数 最 接近 小 波 的 概率 密度 分 布 。 


表 7.8-1 应 用 在 Lena 图 像 系数 上 的 类 型 1. 阶层 3 和 4 的 纯 寻 与 向 于 量 化 的 结果 
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注 ， 表 中 帮 为 码 本 大 小 ,上 为 每 一 向 量 的 维度 : 在 LBG 一 例 中 ， 位 率 而 pp 出 琅 = 2 计算 而 得 ，L-M SNR 
代表 以 Lioyd-Max 量化 器 所 得 的 依 唱 比 ; LBG SNR 则 代表 区 LBG 训 弥 法 所 得 的 向 地 攻 化 器 所 得 的 他 
嗓 比 。 
此 外 , 下 = 工时 ，VQ 变 成 SQ， 但 由 表 中 发 现 此 时 VQ 的 表现 仍 较 SQ 为 佳 。 其 中 的 原因 
很 可 能 是 实际 的 小 波 系 数 密 度 分 布 与 Garmma 函数 有 些许 差异 , 而 LBG 则 仍 适 应 真实 的 小 波 
系数 。 


@@ 小 波 系数 的 统计 分 布 


每 一 类 型 小 波 系数 的 概率 密度 函数 对 于 了 解 在 不 同 解析 度 时 的 行为 非常 重要 。 这 个 结果 
可 用 Lena 的 小 波 系数 来 论证 ， 其 他 图 像 也 有 类 似 结 果 。 图 7.8-3 将 阶层 2 类 型 1 的 小 波 系数 
的 福 率 密度 函数 以 Gaussian 、Laplacian 和 Gatmtaa 函数 来 近似 
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(iD Lena.2.1 


(人 gammatxr'1) 
人 3)] laplacian(x,i) 
(人 4] Eatussianfx,1) 





-2 -0 -8 -4 2 0 2 4 f 8 


图 7.8-3 用 Gaussian、Laplacian 和 人 Gamma 函 效 表示 阶层 为 
且 类 型 为 1 的 小 波 系 数 的 概率 密度 函数 











Gaussian (x,a.)= 1 exp 人 2 12G7 ) (7.8-1) 
2TG: 
1 
Laplacian (xc )= exp 人 2 四 /cr ) (7.8- 分 
125 
Gamma (rr ,)= 妈 exp 人 3 装 1720， 】 (7.8-3) 
8rar 加 





检验 灰 度 图 像 的 小 波 系 数 可 发 现 ， 除 低 解 析 度 外 ， 在 同一 阶层 或 不 同 阶层 的 所 有 类 型 均 
有 类 亿 的 分 布 ， 如 图 7.8-4 所 示 。 


25000 





T 一 | 
Lena.1.1 -一 」 


Lena.l.2 一 一 
Lena.1.3 一 一 


-30 -的 -站 眉 I 的 斩 
图 7.8-4 同一 阶层 下 不 同类 型 的 小 波 系 数 分 布 


表 7.8-2 显示 Lena 图 像 的 小 波 系 数 的 特性 ， 包 括 各 阶层 与 类 型 的 最 大 (Mazx) 与 最 小 值 
(Mim， 平 均值 (Avn) 与 方差 (VanD， 以 及 对 平均 值 与 方差 归 一 化 的 结果 表 中 显示 方差 随 阶 
层 数 的 增加 而 增加 ， 表 示 愈 低频 的 部 分 愈 重 要 。 此 外 ， 从 表 7.8-2 最 后 二 栏 可 看 出 经 归 一 化 
后 ， 不 同 阶层 及 类 型 均 有 类 似 的 结果 ， 这 表示 可 以 用 特 竹 相近 的 量化 器 对 其 量化 。 最后， 和 阶 
层 4 类 型 0 的 意思 是 指 最 低频 或 最 平滑 的 部 分 。 
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表 7.8-2 1ena 转 剧 的 小 波 系 数 的 统计 特性 
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能量 分 布 


从 表 7.8-2 及 图 7.8-4 可 以 看 出 大 部 分 系数 都 非常 小 且 分 布 在 一 个 以 原点 为 中 心 的 罕 小 动 
态 范围 内 ， 且 较 高 阶层 包含 有 较 小 系数 及 方差。 在 表 7.8-2 及 表 7.8-3 中 , 我 们 可 以 看 出 每 一 
阶层 中 ， 类 型 1 和 2 均 比 类 型 3 含有 较 多 能 量 和 较 大 系数 及 方差 。 


表 7.8-3 bena 图 像 之 的 小 让 系 数 的 能 量 分 布 
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此 外 , 阶层 1 比 阶 层 2 的 能 量 低 上 且 系 数 也 较 小 . 阶层 2 又 比 阶层 3 的 能 量 低 及 系数 小 依 
此 类 推 。 


本 节 所 有 数据 及 内 容 均 参 考 Arerbuch et al [1996]， 对 本 课题 有 兴趣 而 欲 知 细节 者 可 自行 
网 读 该 论文 。 


习 题 


1. 设计 一 个 DCT 变换 的 编 解 码 铝 如 下 ; 
(1 图像 分 割 成 不 重 春 的 8x8 方块 ， 分 别 进 行 DCT。 
(2) 按 Zigzag 原 序 只 保持 DC 及 AC1 -~- AC5 共 6 个 系数 ， 其 余 均 取 为 零 。 
(3) 对 各 系数 进行 直方 图 的 统计 ， 估 测 出 六 个 袜 率 密度 函数 ( 设 为 高 斯 ) 的 参数 ( 即 平均 值 
与 偏差 量 )。 
(4) 以 第 三 章 的 方法 为 各 系数 设计 最 佳 的 纯 量 量化 器 (位 数 自选 ) ， 并 对 DCT 系 煞 进行 量化 。 
(3) 进行 反 量 化 及 IDCT， 最 后 重 整 出 整 幅 图 像 。 
(6) 计算 压缩 比 及 重建 图 像 的 PSNR。 
2. 考虑 一 个 8 位 图 像 源 之 雯 的 佑 测 。 设 此 信和 叶 源 产生 如 下 的 像素 值 : 
20 20 20 4 的 的 172 172 172 
20 20 204 6 和 172 172 172 
20 20 20 4 6 名 172 172 172 
20 20 20 4 6 60 172 172 172 
(1 假设 各 像素 值 为 统计 独立 ， 并 视 一 个 像素 值 为 一 个 字 元 符号 ， 求 所 估 测 之 箭 。 
(2 将 (20,20), (20,45), (45,60), (60.60), (60.1721 (172,1723) 视 为 6 个 不 同 的 字 死 符号 ， 重 新 
求 此 字 元 符号 的 业 。 
(3) 取 相 邻 ( 左 ， 右 ) 两 像素 值 的 差 ( 右 减 左 ) 为 字 元 符号 ， 求 其 丧 。 
- 将 上 题 的 三 个 子 题 各 以 徐 夫 曼 编 码 ， 计 算 该 码 的 平均 长 度 及 编码 效率 。 
4. 将 一 个 小 图 像 (16xD 以 PCX 及 CUT 的 RLE 进行 编 解码 ， 比 较 其 压缩 比 。 
模拟 卫 EG 的 变换 与 量化 的 程序 (不 需要 编 0 与 1 的 码 )。 
(1 用 图 7.6-5 的 量化 表 及 将 其 内 容 一 律 乘 上 2 悦 的 量化 表 。 
人 f2) 统计 上 述 两 种 状况 下 量化 后 系数 为 零 的 个 数 ， 个 数 傅 多 通常 表示 编码 后 的 压缩 比 僵 高 。 
G) 依 各 自 的 量化 表 进 行 反 量 化 及 反 变 换 ， 求 其 PSNR。 
人 由 全) 及 (3) 你 觉得 压缩 比 与 机 质 之 间 可 能 有 何 关系 ? 
MPEG 与 JPEG 在 编码 上 有 何 异 同 ? 
设计 一 个 小 波 变换 的 编 解 码 器 如 下 : 
(1) 进行 一 个 如 图 7.8-1 所 示 的 二 层 小 波 变换 得 7 个 频带 。 
人 2) 对 各 个 频带 系数 进行 维度 与 码 本 大 小 均 可 有 所 不 同 的 多 解析 度 码 本 VQ 编码 。 
G) 计算 压缩 比 及 PSNR。 


Te 


内 


7 中 
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图 像 分 拓 处 理 
分 制图 像 的 储存 
图 像 分 割 预 处 理 
一 一 LUM 滤波 器 
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本 章 要 讨论 的 图 像 分 割 (image segmentation) 属于 图 像 分 析 的 中 层 处 理 ， 先 前 各 音 所 介绍 
的 一 些 图 像 技 术 则 可 归 类 为 底层 处 理 的 方法 ， 如 图 8.0-1 所 示 。 下 一 章 的 图 像 表 示 与 描述 仍 
属 中 层 处 理 ， 最 后 一 章 的 图 像 模 式 识 别 则 属 高 层 处 理 。 


ee 必 外 理 





8.0-1 力 像 分 析 的 结构 


中 层 处 理 的 任务 就 是 提取 和 描述 底层 处 理 过 后 的 图 像 ， 以 便 对 于 此 图 像 中 的 物体 更 加 了 
解 其 大 小 、 位 置 、 灰 度 级 等 ， 还 可 和 修饰 物体 的 边界 ， 对 物体 有 更 深 的 措 述 ,甚至 于 将 其 与 背 
景 分 离 。 我 们 必须 了 解 一 点 ; 这 些 技 巧 及 底层 处 理 中 一 些 去 除 干扰 及 去 除 模糊 等 技巧 ， 都 可 
视 为 做 高 层 处 理 的 准备 工作 。 


381 了 奸 论 


我 们 现在 先 举 一 例 子 来 说 明 图 像 模式 识别 (patteim recopmiitiom 的 用 途 。 人 假设 现 有 一 个 将 
水 果 分 类 的 系统 ， 如 图 8.1-1 所 示 。 水 果 的 种 类 包括 栅 要 、 柠 檬 、 苹 果 以 及 将 萄 椒 ， 这 些 水 
果 经 由 输送 带 通 过 监视 器 ， 百 将 这 些 水 果 的 图 像 送 至 处 理 机 去 辨认 ; 而 在 处 理 器 中 根据 这 些 
水 时 的 一 些 特 征 (必须 是 能 使 电脑 分 辨 出 水 果 种 类 的 特征 ) 来 将 水 果 分 类 , 在 此 例 中 用 的 是 大 
小 及 红色 的 程度 ， 如 图 8.1-2 所 示 。 

根据 图 8.1-2 我 们 可 以 很 成 功 地 将 水 果 分 开 、 这 种 系统 将 可 以 取代 传统 的 人 力 ， 并 有 目 较 
为 便利 和 快速 。 在 图 8.1-2 中 ， 我 们 以 天 小 及 红色 的 程度 为 辨认 依据 ， 那 么 这 些 信 息 要 如 何 
获取 呢 ? 第 一 步 就 是 必须 先 将 物体 分 离 出 来 ， 并 分 析 其 大 小 及 色泽 ; 这 里 所 用 的 方法 正 是 我 
们 接 下 来 所 要 介绍 的 方法 图 像 分 割 法 。 
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控制 单元 





画 8.1-2 特征 空间 
8.2 图 像 分 割 处 理 


图 像 分 割 处 理 可 凡 定 义 为 将 一 数字 图 像 分 割 成 若干 区 域 ， 而 这 些 由 僚 素 组 成 的 区 域 必须 
为 各 个 相 类 似 的 像素 相连 而 成 。 而 所 谓 “ 相 连 ” 是 指 在 连 遂 (connected) 的 集合 中 , 任 两 个 像 
至 之 同 有 一 条 相连 的 路 径 ， 且 此 路 径 都 是 由 集合 中 的 像素 所 组 成 。 至 于 相 过 的 路 径 ， 则 由 像 
束 间 的 连通 性 来 决定 。 常 用 的 连通 性 有 下 列 两 种 ; 

忆 ) 四 连通 (fpurconnectivity): 即 对 一 像素 而 言 ， 其 与 上 、 于 、 左 、 右 的 像素 相连 。 

多 入 连通 (eight-cohfnectivityj)， 即 附 了 上 、 于 、 左 、 右 的 像素 外 ， 还 加 上 对 角 连 线 上 的 

像素 ， 故 有 八 个 像素 与 其 相连 。 

图 像 分 割 大 致 有 四 种 方法 可 以 实现 ， 

中 阔 值 法 :这 是 一 种 以 冰 值 为 界 区 分 物体 与 背景 的 简单 方法 。 

包 区 域 法 : 这 是 一 种 仅 认定 某 一 个 像素 集合 为 一 个 物体 或 区 域 的 方法 。 

动 边界 法 : 这 是 找寻 存在 两 个 区 域 之 间 边 界 的 方法 。 
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电 边缘 法 : 辨认 像素 的 边界 ， 并 且 将 它们 连结 在 一 起 找 出 移 体 边界 的 方法 。 


8.2-1 阅 值 法 实现 图 像 分 割 


阔 值 法 主要 舍 设 定 阔 值 来 分 辩 物 体 与 背 有 最。 简 言 之 就 是 在 图 像 的 灰 度 值 中 . 选 一 适合 的 
阐 仿 ; 若水 于 阔 值 ， 则 判 为 背景 ; 大 于 阐 值 ， 则 判 为 物体 ， 央 此 这 种 方法 很 适合 用 于 图 像 中 
的 物体 有 一 明显 的 区 域 分 界 且 边界 为 封闭 的 情况 - 亦 即 ， 若 所 感 兴趣 的 物体 和 背景 之 间 的 灰 
度 值 有 明显 差异 时 ， 出 立 值 将 可 完全 地 分 割 物体 与 背景 : 


刍 整体 阅 值 (Global Threshoiding) 


这 个 方法 是 对 整 焉 图 像 选 定 一 固定 灰 度 值 ， 并 以 此 值 去 做 此 园 像 的 分 类 ， 以 找 出 此 图 像 
的 物体 ， 此 方法 很 简单 ， 但 因为 步骤 仅 将 忒 度 值 分 为 高 、 低 两 类 ， 因 此 只 在 物体 与 背景 单纯 
且 亮 暗 分 明 下 ， 才 会 有 好 效果 。 

对 此 国定 刻 值 的 选择 ， 一 般 采 用 的 是 直方 图 法 : 先 将 每 一 像素 的 灰 度 值 按 出 现 频率 做 -一 
份 数据 统计 并 画 臧 图 8.2-1 所 示 的 图 形 。 由 几 3.2-1 看 出 这 是 一 幅 物 鸽 与 背景 分 明 的 图 像 、 我 
们 可 直接 在 交会 点 (如 边界 ) 之 处 选择 其 灰 度 值 作为 门限 ， 由 直 党 上 可 知 这 就 是 最 佳 临界 点 
To 的 选择 。 


款 让 本 过 由 


7 灰 麻 
图 8.2-1 整体 阔 值 的 最 佳 进 择 
名 适应 性 阔 值 (Adaptive Thresholding) 


在 很 多 的 情况 下 ， 图 像 并 不 像 上 面 所 述 那样 单纯 ， 背景 上 可 能 有 很 多 的 变化 ; 在 这 种 情 
总 下 ， 可 能 某 些 区 域 中 所 用 的 闽 值 ， 就 不 能 用 在 别 的 区 域 上 ， 当 然 最 好 的 方法 就 是 在 不 同 的 
区 域 ， 有 不 同 的 阔 值 ， 亦 即 自 适 性 的 鹿 值 。 

为 了 适应 图 像 局 部 的 变化 ， 盖 值 可 依 下 面 的 步骤 来 求 得 ; 

步骤 一 : 先 将 欲 做 分 析 的 图 像 分 成 若 于 子 图 像 ， 并 就 每 个 子 图 像 做 直方 图 的 分 析 ， 去 撞 

单 峰 (animodal 的 直方 图 ， 只 记录 具 双 峰 fbimodal) 的 直方 图 ， 
步骤 二 : 在 背 最 的 灰 度 值 与 物体 的 灰 度 值 中 ， 选 择 中 间 值 来 作为 疫 值 。 
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8.2-2 区 域 法 实现 图 像 分 割 


设 丸 代表 整个 图 像 区 域 ， 图 像 分 割 可 闹 为 将 只 分 制 成 上 个 于 区 域 R, RRP2，…, Ra 的 过 程 ， 
而 这 些 子 区 域 必须 满足 


(人 UR = 中 


(2) 尺 是 相连 接 {connecte 田 的 区 万 ,= 1 2 严 

G) 郧 如 = 及 ( 空 集合 )，YP 7 7 

人 GPR =TURE，i= 1 2 

(5) PR HUjR)=FALSE，iz7 
其 中 PCR) = TURE 代表 在 总 中 所 有 像素 都 有 某 种 共同 的 特性 ， 例 如 全 部 像素 的 灰 度 都 相同 。 

以 区 域 法 实现 分 割 便 是 遵循 上 述 的 福 念 ， 以 直接 找 取 区 域 的 方式 实现 图 像 分 制 。 主 要 方 
法 有 二 ， 一 是 所 谓 的 像素 聚 类 区 域 成 长 法 (tegion growing by bixel aggregation) 以 及 区 域 分 荐 
与 合并 法 (region spiitting and merging)。 


和 做 素 聚 类 区 域 成 长 法 


顾名思义 ， 此 方法 从 一 种 子 (seed) 像素 开始 ， 通 过 像 平均 灰 度 、 组 织 纹 理 及 色彩 等 性 质 
的 检视 .将 具 类 似 性 质 的 像素 逐一 纳 人 所 考虑 的 区 域 中 ， 使 其 逐渐 成 长 。 此 方法 在 和 概 念 上 很 
简单 ， 但 在 实际 使 用 时 必须 考虑 许 光 因素 。 

首先 是 种 子 像素 的 选择 . 这 又 分 是 否 事先 对 所 考虑 的 图 像 的 特性 已 有 了 和 解 。 若 已 了 解 ， 
则 较 易 选 定 ， 例如 在 红外 线 图 像 的 军事 用 途上 ， 通常 被 追踪 的 目标 温度 较 高 ， 因 此 在 红外 线 
图 像 上 亮度 较 高 。 若 无 足够 信息 直接 选取 种 子 像素 ， 可 对 图 像 进行 直方 图 分 析 ， 找 到 出 现 次 
数 较 大 者 当做 种 子 像素 。 

另 一 个 问题 是 萌 类 的 相似 性 的 选择 。 这 个 问题 与 应 用 对 象 有 密切 关联 性 ， 直 过 大 致 土 不 
外 乎 灰 度 、 组 织 纹 理 、 色 彩 等 性 质 。 此 外 ,， 何 时 该 停止 成 长 也 必须 考虑 ， 当 然 最 简单 的 就 是 
说 再 也 找 不 到 符合 聚 类 性 质 的 像素 时 就 该 停止 。 其 他 的 停 赴 条 件 还 下 包括 区 域 大 小 及 形状 
等 。 

在 实际 的 应 用 中 ， 也 许 无 法 一 次 就 找到 满意 的 分 割 ， 因 此 有 一 些 选 代 式 的 方法 。 首 先 判 
别 分 宕 边 界线 两 边 的 边界 点 性 质 的 差异 是 否 很 大 ， 若 是 则 称 为 强 fstrong) 边界 ， 反 之 则 为 弱 
(wealg 边界 。 强 边界 保留 不 动 ， 萌 边界 可 去 除 , 使 部 分 边界 合并 。 此 过 程 持续 进行 到 没有 一 
个 导 边 界 为 止 。 


@ 区 域 分 割 与 合并 法 


首先 将 图 像 分 割 成 不 重 权 的 区 域 ， 其 中 最 常用 的 方法 是 分 割 成 四 个 大 小 相同 的 子 图 像 。 
若 每 个 子 图 像 内 有 性 质 不 同 的 图 像 存 在 就 将 该 子 图 像 继续 分 割 ， 持 续 这 个 过 程 直到 没有 可 再 
分 割 的 条 件 为 止 。 接 着 将 具 同 性 质 又 相 邻 的 子 区 域 进行 合并 ， 直 到 无 法 再 合并 为 止 ， 整 个 图 
像 分 割 程序 才 算 大 功 告 成 - 图 8.2-2 显示 一 个 图 像 分 割 情形 及 其 伴随 的 四 又 衬 (quadtree) 数据 
结构 表示 方式 。 图 8.2-3 则 显示 用 区 域 分 割 与 合并 的 例子 。 
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本 加 (en (加 ) (ea (Rs 


全 分 割 名 像 人 b) 伴随 的 四 又 树 
国 8.2-2 





图 8.2-3 区 域 分 前 与 合并 法 的 例子 
8.2-3 边界 法 实现 图 像 分 割 


边界 法 是 借助 求 一 由 图 像 的 梯 许 大 小 来 正确 地 找 出 边界 的 图 像 分 割 法 。 设 一 输 和 人 图像 为 
(cx 及 ， 则 其 梯度 为 向 量 


We= 总 Ji+ 革 7 贡 (2.1) 


其 大 小 jyr(x,y 代 表 在 梯度 向 量 所 指 的 方向 上 ro y 每 单位 距离 的 最 大 增加 率 。 求 此 梯度 大 
小 的 有 的 是 要 乒 出 图 像 中 区 诬 变 化 最 大 的 位 置 ， 而 这 些 灰 度 变化 很 大 的 位 置 、 通 常 正好 就 是 


生 边界 追踪 


首先 我 们 对 一 幅 图 像 求 一 阶 导 数 得 到 一 幅 梯 度 大 小 的 图 像 。 由 梯度 大 小 的 图 像 找 出 一 些 
灰 度 值 较 大 的 像素 ， 从 这 些 像 素 中 再 挑 一 个 出 来 (例如 最 大 者 ) 作 为 追踪 的 起 点 ， 接 着 在 与 起 
点 相 邻 的 点 中 找 出 灰 度 最 大 的 点 当做 第 二 点 。 现 在 把 起 点 当做 过 去 的 边界 点 ， 而 第 二 点 当做 
现在 的 点 ， 再 从 与 现在 的 边界 点 相 邻 的 点 中 ， 找 出 位 于 与 过 去 的 边界 点 相对 面 的 像素 ， 作 为 
下 一 个 候选 边界 点 ， 从 中 选择 菊 度 较 高 者 作为 下 一 个 边界 点 ， 如 图 8.2-4 所 示 。 如 果 三 个 或 
相 邻 两 个 收 选 边界 点 有 相同 的 最 大 藉 度 值 ， 则 选择 中 间 者 为 下 一 个 边界 点 ; 如 果 不 相 邻 的 两 
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个 候选 边界 点 有 相同 的 最 太 灰 度 值 ， 则 此 两 点 中 任 一 点 都 可 选 为 下 一 个 边界 点 。 如 此 重复 ， 
最 后 找 出 整个 边界 。 


DT 
可 TD 有 同 ， asam 


图 8.2-4 边界 追踪 


边界 追踪 法 适合 在 没有 干扰 的 情况 下 操作 ; 假设 梯度 图 像 中 边界 已 被 干扰 破坏 ， 则 显然 
极 易 追 踪 错 误 。 其 解决 之 道 有 二 ' 一 是 在 追踪 前 先例 平滑 (smoothing) 去 噪声 ， 二 就 是 下 面 要 
提 到 的 追踪 出 (tracking bugy 的 方法 。 

首先 我 们 先 定 义 矩 形 大 小 作为 检视 的 窗口 ， 如 图 8.2-5， 我 们 称 之 为 虫 。 在 图 上 可 以 看 到 
有 一 个 过 去 的 边界 点 及 一 个 现在 的 边界 点 ， 我 们 选择 以 由 过 去 及 现在 的 则 界 点 所 构成 的 方 
向 ， 作 为 目前 的 方向 。 以 此 方向 为 准 的 +6 方向 内 都 是 下 一 个 边界 点 的 搜寻 范围 ， 接 着 计算 
在 搜寻 范围 内 各 个 位 置 的 虫 所 涵盖 的 点 的 梯度 平均 值 . 选择 平均 值 较 大 者 所 含 的 候选 边界 为 
下 一 个 边界 点 。 这 种 方式 不 同 于 上 述 之 处 是 在 于 : 此 活 所 用 的 窗口 拉 大 了 搜寻 有 较 高 灰 度 点 
的 范围 ， 而 这 个 窗口 的 大 小 ， 可 依 实际 的 情形 而 调整 。 办 为 整个 方法 的 动作 犹如 虫 一 步 一 步 
往 前 进 ， 故 得 其 名 。 











目前 边界 点 


先前 边界 点 





图 8.2-5 边界 追踪 虫 


9 梯度 大 小 卫 值 法 


图 8.2-6 显示 梯度 大 小 图 像 某 一 行 的 灰 度 值 变化 。 一 开始 本 方法 从 较 小 的 阔 值 开始 (例如 
8.2-6 中 的 )， 此 时 有 许多 相连 的 部 分 超过 此 闭 值 ， 接 着 和 逐渐 增加 冰 值 时 ， 可 相连 的 部 分 
恶 渐变 小 ， 到 阀 值 等 于 刀 时 发 现 相连 部 分 只 剩 一 点 ， 该 点 即 视 为 边界 点 ， 同 理 当 闪 值 逼近 
六 时 又 得 另 一 迪 界 点 ， 依 此 类 推 。 
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图 8.2-6 梯度 大 小 阅 值 分 割 法 的 示意 玖 ， 
这 样 的 作法 有 一 个 很 大 的 好 处 ， 就 是 在 一 幅 有 效 个 物体 及 背景 变化 丰富 的 图 像 上 ， 可 以 
找 出 较 正 确 的 边界 。 但 图 像 在 做 梯度 运算 前 ， 须 先 平 滑 以 降低 噪声 对 边界 的 损害 。 
鱼 拉 氏 边界 检测 法 


二 失 导 数 也 是 一 个 搜寻 人 边界 不 错 的 方法 。 接 氏 边 界 检 测 (Laplacian edge detection) 用 的 是 
二 阶 导 数 的 方法 ， 其 定义 为 


Yo- A++ 二 Cn (2.3 
天 9j 
在 数字 图 像 上 是 使 用 图 8.2-7 所 示 的 拉 氏 郑 积 核 (Laplacian convolution kernels) 中 的 一 个 去 做 二 阶 


导数 的 计算 。 图 8.2-8 中 可 看 到 一 边界 的 一 阶 导数 及 二 阶 导数 的 表示 图 形 。 一 阶 导数 是 以 最 大 值 
作为 边界 的 设 定 ， 而 二 阶 导数 是 以 其 陡峭 下 滑 且 越 堆 点 (zero 人 rossing) 的 位 置 来 找寻 边界 。 








图 8.2-7 拉 式 卷 积 核 


由 于 Laplacian 算 子 是 二 内 导 数 , 因此 它 对 于 噪声 有 极 高 的 敏感 性 ， 而 且 对 于 双边 缘 带 不 
易 检 测 出 边缘 的 方向 。 基 于 这 些 原因 ，Laplacian 较 一 阶 导 数 少 用 。 之 前 谈 到 过 要 降低 噪声 的 
影响 ， 可 先 做 平滑 操作 ， 而 具有 Gaussian 脉冲 响应 的 低 通 滤波 器 便 是 一 个 很 好 的 选择 。 设 


Gaussian 形式 的 脉冲 响应 为 姑 x, 用 = 串 - 蕊 二 了 } 其 中 5 为 标准 差 。 则 取 Gaussian 响应 





2 


的 Laplacian， 就 成 了 拉 氏 一 高 斯 滤波 器 的 响应 
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0 边缘 
-1 
-4 -2 有 2 4 
-1 
| 人 
1 
-4 -2 0 2 4 


苗 8.2-8 一 边界 的 一 阶 导数 及 二 阶 导 数 的 表示 图 形 


| 有 于 - ] (8.2-3) 
好 2 
其 中 = 关 + 畏 。 图 8.2-9 是 拉 氏 一 高 斯 滤波 器 的 响应 图 。 


0.]15 





局 





-5 -5 
本 8.2-9 拉 氏 一 高 斯 滤波 器 的 响应 困 
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8.2-4 边缘 法 实现 图 像 分 割 


边缘 法 是 另 一 种 建立 边界 的 方法 ， 它 是 用 一 阶 导数 的 大 小 检测 出 这 乡 {edge) 所 在 并 用 一 
阶 导 数 的 方向 将 小 的 边缘 连结 成 边界 的 方法 。 


昌 检测 (Detection) 

在 这 里 “检测 ”是 指 利用 一 阶 导 数 算 子 来 对 图 像 求 梯度 ， 以 找 出 边缘 。 在 数字 图 像 处 理 
中 ， 求 梯度 通常 是 利用 下 列 几 种 算 子 来 实现 : 

Sobel 边缘 算 子 ( 牌 直 与 水 平方 向 的 边缘 ) 





鳃 连结 (Linking) 


在 理想 状况 下 ， 由 前 面 检测 出 的 边缘 点 图 像 所 形成 物体 的 边界 会 是 相连 且 封 闭 的 - 但 实 
际 上 由 于 噪声 、 光 源 不 均匀 等 因素 通常 得 到 的 结果 是 残 缺 不 全 的 边界 ， 所 以 要 作 连 结 收 补 : 
最 简单 的 连结 方法 是 用 一 个 小 视窗 (3 x3 或 5x 5， 将 具有 基 种 共同 特性 的 边缘 结合 ， 此 
特性 可 包括 梯度 大 小 及 方向 。 在 一 个 值 内 具有 相近 的 梯度 大 小 及 方向 者 将 其 连结 成 边 兴 ， 
相对 这 个 以 小 视窗 为 考虑 范围 的 局 部 (localD 处 理 ， 续 下 来 将 介绍 一 个 整体 (globaD 处 理 做 连 
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结 的 方法 一 一 ough 变换 . 
我 们 由 图 8.2-10 来 解释 Heugh 变换 。 候 设 在 xy 的 坐标 上 有 几 个 点 ， 如 图 8.2-10 (所 
示 。 由 它们 分 布 的 情况 来 看 ， 可 完全 由 一 直线 方程 式 来 代表 





= ar (8.2-4) 
某 中 a 与 日 为 常数 。 由 于 仅 知道 几 个 点 的 位 置 (x,) 六 ,我 们 将 其 转换 至 c 妨 坐标 上 
六 = 一 (8.2-5) 


现在 视 x 与 为 常数 。 从 几 个 不 同 的 点 可 画 出 几 条 线 来 . 如 图 8.2-10(b) 所 未。 假设 现在 有 两 
条 线 5= 放 一 az 与 B= 尹 一 ar: 相交 于 人 ;下 的 点 上 ， 这 就 代表 了 此 二 点 名 ,为 ) 与 (zx , 力 ) 有 共 
同 的 方向 ， 再 把 它们 相连 。 当 然 在 zx, ? 坐标 上 分 布 的 点 ,并非 刚 好 很 准确 地 可 用 一 方程 式 表 
示 ， 所 以 我 们 将 &, 闫 平面 做 一 个 量化 .也 就 是 分 为 好 几 个 小 区 域 来 表示 ; 若 解 册 的 (e, 信 在 同 
一 区 域 中 ， 则 称 其 同一 方向 ， 并 做 一 统计 : 各 区 域 伴 随 一 累加 器 ， 若 解 出 在 某 区 时 ， 该 区 域 
的 累加 器 就 如 1。 依 次 做 完 所 考虑 的 点 后 ， 就 可 以 看 到 它们 大 致 分 布 的 情形 ， 也 可 以 找 出 一 
条 大 致 可 代表 这 些 点 的 则 线 。 我 们 可 将 马 ? 坐标 表示 为 极 坐标 ， 依 同样 的 观念 .来 做 Hough 
变换 ， 如 图 8.2-10(e) 所 示 。 


了 


9 o 


fa) xz 坐标 上 的 点 了 b) 换 成 as 太 坐 标 . 并 将 其 区 域 量 化 


(o) 此 为 人 b) 的 极 谷 标 版 本 


玫 8.2-10 ”Hough 变换 


8.3 ”分割 图 像 的 储存 


在 图 像 分 析 中 ， 我 们 常 希 望 将 物体 重新 排列 、 整 理 ， 或 是 需要 将 物体 个 别 展 示 ， 所 以 我 
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们 必须 将 物体 抽出 并 且 以 更 方便 的 形式 储存 起 来 。 以 下 介绍 两 种 方式 ， 分 别 是 边界 连锁 及 线 
县 编 码 法 。 


8.3-1 边界 连锁 码 


过 界 过 镇 编码 (boundary chain code) 是 以 边界 来 定 尽 物体， 所 以 它 不 必 储 存 物体 内 部 像 
素 的 位 置 ， 假 设 我 们 从 一 位 于 zx, 平面 的 物体 的 边界 出 发 ， 在 边界 上 任 选 一 点 ， 而 在 以 它 为 
中 心 与 其 相 邻 的 点 中 一 定 也 存在 有 边界 点 。 现 在 这 八 个 相 邻 点 有 八 个 不 同 的 方向 ， 分 别 以 0 
~ 了 代表 这 八 个 方向 ， 如 图 8.3-1 所 示 。 





图 8.31 边界 亿 踪 方向 


如 此 以 边界 追踪 的 方式 寻找 边界 ， 并 将 每 个 边界 的 位 置 储存 起 来 ， 便 可 将 物体 的 数量 、 
周 长 以 及 连锁 编码 记录 在 存储 器 中 。 这 种 方法 最 大 的 好 处 就 是 节省 存储 器 空间 ， 但 由 于 物体 
内 部 点 并 没有 储 仓 ， 故 这 方面 的 数据 并 没有 留 下 ， 不 过 若 我 们 所 感 兴趣 的 只 是 边界 ， 那 么 内 
部 的 数据 记录 与 否 就 没有 关系 了 。 


8.3-2 ”线段 编码 


线段 编码 (line segment encoding) 与 上 述 的 方法 不 同 的 地 方 就 是 它 可 储存 物体 中 每 一 点 
的 数据 。 这 是 一 种 以 线段 屠 存 的 方法 。 我 们 以 图 8:3-2 为 例 来 说 明 其 储存 的 操作 。 


行 数 





加 一 


图 8.32 和 畅 体 的 线形 片段 砷 示 


假设 现 有 物体 如 图 8.3-2 所 示 。 在 第 1 行 时 检测 到 有 一 列 分 割 的 图 像 ， 接 着 我 们 就 把 它 
视 为 第 一 个 物体 中 的 第 一 列 ， 符 号 记 下 1-1， 接 着 在 第 2 行 检测 到 有 两 列 ; 第 一 列 因 处 于 1-1 
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的 下 方 ， 所 以 记 做 1-2; 而 第 二 列 为 一 新 的 物体 .所 以 记 做 21。 如 此 检测 到 第 4 行 时 发 现 只 
有 一 列 卫 位 于 物体 1 及 物体 2 的 下 方 ， 所 以 原先 视 为 两 个 物体 的 图 像 原 来 为 同一 物体 ， 但 先 
记 做 14， 等 待 全 部 扫描 完 之 后 ， 再 作 合并 的 操作 。 每 个 物体 储存 的 信息 包括 有 : 第 几 个 物 
体 、 共 分 为 几 列 ， 接 着 是 各 列 的 数据 。 在 此 例 中 因 物 体 1 和 物体 2 是 同一 物体 ， 但 在 全 部 未 
扫描 完 之 前 以 此 储存 ， 待 扫描 完 后 ， 物 体 2 将 与 物体 1 合并 记录 下 来 。 

这 种 技巧 所 记录 下 来 的 数据 可 包括 : 区域 面积 、 周 长 、 物 体 特征 、 分 割 的 图 像 的 大 小 、 
宽度 以 及 物体 的 总 数 等 ; 较 前 述 方法 储存 的 数据 多 了 许多 ， 但 相对 也 要 占用 较 大 的 存储 器 空 
间 。 

在 本 章 一 开始 时 提 到 去 除 噪声 与 去 除 模糊 等 工作 是 属于 图 像 分 析 的 前 期 处 理 ， 它 是 方便 
像 图 像 分 割 这 种 中 层 处 理 而 设计 。 虽 然 在 第 四 章 贸 像 增 强 与 第 五 章 图 像 恢 复 中 提 到 这 些 底层 
工作 ,但 是 以 下 将 介绍 一 种 更 强 而 有 力 的 方法 ， 它 是 同时 可 去 除 只 声 及 模糊 的 图 像 分 割 预 处 
理 方法 ,对 实际 上 面 对 的 图 像 分 割 问题 非常 有 帮助 。 


8.4 图 像 分 割 预 处 理 一 -LUM 滤 访 器 


本 节 将 介绍 图 像 分 割 预 处 理 所 使 用 的 LUM (lower-uppermiddqle) 滤波 器 。LUM 滤波 只 名 
称 的 由 来 万 是 因为 在 滤波 器 的 演算 法 则 中 是 以 样本 中 较 发 阶 统计 量 (lower order statistics) 及 
较 高 阶 统 计量 (upper order statistics) 与 样本 中 间 值 做 比较 以 运算 出 输出 值 。 借 助 适当 的 参数 
选取 ，LUM 滤波 器 可 以 当 迟 平滑 化 滤波 器 ， 亦 可 当做 锐 化 滤波 器 使 用 。 

以 排序 为 基础 的 滤波 器 被 广泛 地 运用 来 达到 平滑 化 效果 。 首 先 便 是 到 和 月 前 为 止 可 能 仍 是 
最 广 为 被 运用 的 中 值 滤波 器 ， 中 值 滤波 器 及 其 特性 在 本 书 5.2 节 中 已 有 详细 撒 述 ， 此 处 不 多 
做 鳌 述 。 在 许多 应 用 中 ,中 值 滤波 器 会 引 人 过 多 的 平滑 效果 ， 而 这 些 被 引 人 的 模糊 效果 可 能 
会 对 后 续 的 处 理 产生 比 图 像 原 始 噪声 (original noise) 更 不 利 的 影响 。 在 LUM 滤波 器 中 , 平滑 
特性 由 2 个 参数 中 的 第 1 个 参数 所 控制 ， 这 个 参数 的 调整 可 在 从 无 平滑 效果 到 与 中 值 滤波 等 
效 的 区 间 内 改变 平滑 化 级 别 。 借助 控制 这 个 参数 可 在 噪声 平滑 化 与 保存 图 像 细 节 之 间 得 到 一 
个 良好 的 平衡 。 

LUM 滤波 器 亦 可 被 设计 成 具有 增强 边缘 特性 的 功用 ,而 增强 的 幅度 可 伐 助 控制 LUM 滤 
波 器 的 第 2 个 参数 来 达到 。 传 统 上 边缘 的 增强 与 锐 化 都 是 使 用 线性 的 技巧 来 达到 ， 包 丘 
Wiener 滤波 器 与 高 通 滤波 等 。 在 许多 情况 下 ， 线 性 技巧 均 有 和 良好 表现 , 但 也 有 许多 不 理想 的 
情况， 例如 线 广 锐 化 器 经 常 导致 边缘 增强 得 太 过 与 不 足 ， 间 时 也 具有 放大 背景 噪声 的 倾向 。 
相形 之 下 ，LUM 滤波 器 骨 不 会 有 上 述 情 况 ， 又 可 在 增强 边缘 特性 的 同时 达到 对 相 加 性 噪声 
不 敏感 及 去 除 脉冲 型 噪声 的 效果 。 

由 于 LUM 滤波 器 可 避免 传统 平滑 滤波 器 与 线性 锐 化 器 的 缺点 ， 故 Hardie 与 Boncelet 曾 
提出 以 LUM 滤波 器 为 预 滤 波 器 的 Sobel 算 子 边缘 检测 方法 ， 并 证 实 其 效果 比 以 中 值 滤波 器 
为 预 滤波 器 时 良好 。 首 之 ，LUM 滤波 器 有 如 下 的 优点 ， 

电 不 须 牺 竹 其 简易 性 便 具 有 多 用 途 功 能 。 
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四 使 参数 的 选择 变 得 单纯 且 直 觉 。 
鲜 同时 具有 去 除 噪 声 与 保存 信号 特性 的 良好 效果 。 
邮 可 根据 图 像 特 性 调整 其 性 能 。 


@ LUNMI 平滑 滤波 器 


考虑 一 售 有 六 个 样本 的 窗 函 数 (window functiom， 如 图 8.4-1 所 示 。 其 中 窗 郑 数 的 中 心 样 
本 为 ， 六 为 订 数 。 其 表示 式 为 


栈 ={fzisraorxy 《8.4-1) 


于 


图 8.4-1 含有 上 个 样本 的 窗 函 数 


此 样本 集 的 排序 形式 可 写 为 
0 委 生生 (8.4-2) 
定义 1: 具有 丰 和 参数 的 LUM 平滑 滤波 器 其 输出 为 
罗 =medtzwyz xureno] 人 8.4-3) 


此 处 》 为 窗 函 数 中 心 样本 的 估 测 ，xu 为 样本 集中 的 较 低 阶 统计 量 ，xw un 为 样本 集中 的 较 
高 阶 统计 量 ，1 反 天 所 (CNY+D12 。 

根据 (8.4-3) 式 可 知 ， 当 x < xu 时 ，LUM 平滑 滤波 器 输出 为 xb。 若 世 > xwun 时 , 输 
出 为 的 tn ， 和 否则 输出 即 为 zx ， 如 国 8.4-2 所 示 。 





式 明 AN -ZE+D) 


图 8.4-2 LUM 平滑 滤波 器 的 输出 


在 定 六 中 将 中 间 样 本 与 较 低 阶 及 较 高 阶 统 计量 做 比较 的 理由 是 : 这 些 排 序 的 统计 量 形成 
一 个 常态 倩 化 normal-valued) 的 样本 范围 。 若 * 位 于 范围 内 ， 则 将 不 对 其 做 任何 修正 ;反之 
如 果 r* 位 于 范围 外 ， 则 以 较 接近 样本 集中 间 值 的 样本 取代 ， 因 此 这 样 的 方式 具有 平滑 的 功 
能 。 鲍 如 ; 若 x 为 一 脉冲 型 躁 声 ， 则 显然 它 极 可 能 落 在 低 阶 统计 量 及 高 阶 统计 量 所 形成 的 范 
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围 之 外 ,， 则 关 将 被 较 接 近 样 本 集中 间 值 的 样本 取代 、 而 唆 声 也 哆 之 移 除 。 

参数 上 控制 了 滤波 器 的 平 清 特性 ， 并 且 可 经 调整 以 使 平滑 曲 声 与 保存 信号 细节 间 的 最 佳 
平衡 . 当 上 =(Y+l)12 时 .LUM 平滑 溃 波 回 的 输出 为 丈 的 中 值 ， 同 时 这 也 是 LUM 平滑 滤波 
器 输出 所 能 达到 的 最 大 平 清 效 果 。 当 上 递减 时 ， 沥 波 器 的 细节 保存 特性 亦 随 之 改善 . 当 开 为 
1 时 ，LUM 平滑 副 变 器 成 为 一 个 恒 荨 滤波 器 (identity flten ( 亦 即 了 =x )。 


昌 LUM 锐 化 滤波 器 


LUM 平滑 滤波 器 与 其 他 以 排序 为 基础 的 滤波 器 一 样 均 是 借助 将 样本 朝 中 值 方向 移动 来 
得 到 平滑 特性 . 但 是 为 了 得 到 锐 化 特性 . 样本 必须 是 朝向 极端 不 同 的 排序 方向 移动 , 换言之 . 
也 就 是 远离 样本 集 的 中 间 值 。 这 同时 也 是 LUM 锐 化 滤波 器 的 运算 原理 。 

在 定义 LUM 锐 化 滤波 器 之 前 ， 我 们 必须 先 定义 一 个 位 于 低 阶 统计 县 与 高 阶 统计 量 (xu 
与 wwan ) 中 间 的 值 。 这 个 中 间 点 (或 是 羊 均值 )， 表 未 成 5 ， 其 定义 如 下 





声 二 了 (xn 十 xn 】 (人 .4-4) 
此 处 1 反 1 二 (YY+HDA2 
定义 2: 具有 1 参数 的 LUM 锐 化 滤波 器 其 输 绸 为 
2 如果 xn < 冯 吉 
》 = 区 (NI401 如 果 忆 < 福 XUN-H4D (8.4-5) 
x， 其 他 情况 





如 此 一 来 车 xn < <xwu ， 则 区 会 根据 与 xm 或 xw un 间 何 者 距离 较 近 ， 而 向 外 远离 
该 点 ， 否 则 xx 将 不 会 有 任何 改变 ， 如 图 8.4-3 所 示 。 这 个 锐 化 操作 的 理由 是 、 若 
zs < <xura， 则 习 可 视 为 一 侠 坡 上 的 一 个 转折 点 (tansition) 样本 , 借助 将 忆 往 两 个 极 员 
不 同方 向 移动 ,我 们 移 去 了 转折 点 样本 因而 创造 一 个 更 陡峭 的 落差 。 





转 8.4-3 LUM 锐 化 滤波 器 


借助 改变 参数 ! 的 值 可 达到 司 锐 化 级 别 变 化 的 目的 。 在 7= (YY+HD/2 的 情况 下 ， 没 有 任何 
锁 化 效果 . 此 时 LUM 锐 化 涉 波 器 仅 是 一 恒 等 滤波 器 。 当 在 ;=1 的 情况 下 ， 由 于 > 往 两 个 极 
端 方向 统计 量 ”% 或 xm 移动 的 缘 改 ， 会 造成 最 大 的 锐 化 效果 : 
名 LUM 滤波 器 

为 了 得 到 一 个 效能 良好 且 又 能 滤 除 噪 声 的 加 强 滤波 器 ， 必 须 将 LUM 平滑 滤波 器 及 锐 化 


滤波 器 的 概念 加 以 结合 ， 如 此 就 得 到 一 个 通用 的 LUM 滤波 器 。 在 定义 LUM 滤波 器 前 ， 我 们 
须 先 定义 如 下 的 低 阶 与 高 阶 统计 量 
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2 = med{xw ,0 | (全 .4-6) 
xz = med{ zt ,2 -ID } (8.4- 旋 


此 处 1 三 正和 1 生 (Y+DA2 ， 注意 其 中 妨 科 zx 。 


通用 LOUM 滤波 器 的 输出 由 痉 或 刀 二 者 间 较 靠近 中 心 样本 关 者 给 定 。 参 数 下 及 1 可 
视 为 可 调整 型 参数 ， 将 使 得 LUM 泪 波 器 的 特性 具有 变化 性 。 稍 后 的 叙述 中 将 有 更 狗 的 
说 明 。 

下 面 将 列 出 两 组 等 义 但 形式 略 有 不 同 的 数学 等 式 ， 亦 即 LUM 滤波 器 的 定义 。 其 中 定义 
3 由 ) 较为 直接 。 

定义 3( 们 : LUM 滤波 器 的 输出 为 


_ 2， 如 果 关 所 ( 革 + 刀 ) 2 
”zz， 其 他 情况 


定义 3 人): 另 一 个 LUM 滤波 器 的 定 咏 为 


2 如 果 x < 2 
Xin， 如 果 xom 公 守 志 

7 =1xwnnp， 如 果 丰 < <xor nn (8.4-9) 
xov-k， 如 果 辣 wa 共 关 


xz， 其 他 情况 


此 处 己 为 在 (8.4-4) 式 中 所 定义 的 中 间 点 。 

不 考虑 如 何 实现 的 问题 ，LUM 波 波 器 的 表现 展现 了 关联 性 简单 的 功能 。 若 < xn 时 ， 
LUM 滤波 器 的 输出 为 xb ; 同 理 , 若 z > xuo 时 ，LUM 滤波 器 的 输出 为 un 。 如 此 一 
来 , 便 如 LUM 平滑 滤波 器 一 般 ， 样 本 xu 与 xw un 在 LUM 滤波 器 的 输出 上 形成 了 界限 。 另 
一 方面 . 若 zm < < 时 ， 则 中 心 样本 会 根据 r 与 xn 或 xw wo 间 何 者 距离 较 近 ， 而 向 
外 远离 该 点 ， 就 如 同 LUM 锐 化 滤波 器 一 般 。 若 立 的 位 置 是 在 xu 冯 呈 三 xn 或 
nb 和 2 么 Xuan 时 ， 则 滤波 对 该 样本 无 任何 影响 。 

借助 操控 参数 上 与: ，LUM 滤波 器 呈现 了 其 特性 的 变化 。 为 了 描述 这 样 的 变化 及 阐明 
LUM 滤波 问 的 定义 ， 图 8.4-4 描述 了 一 些 特 例 及 通 例 下 的 泪 波 程序 。 图 中 呈现 了 一 组 排序 统 
计量 的 集合 。 样 本 范围 自 堪 至 右 的 变化 为 由 小 至 大 递增 。 阴 影 的 部 分 表示 中 心 样 本 不 爱 影 响 
的 范围 - 

图 8.4-4 (a) 显示 当 ! = (W+D/2 且 大 值 变动 的 情况 。 此 处 滤波 器 的 功能 为 LUM 平滑 滤波 
器 。 当 大 值 递增 时 ， 其 平滑 程度 亦 随 之 增加 。 若 上 = IT= (w+D/A2 ， 则 此 时 LUM 滤波 器 相当 
于 中 值 滤波 器 。 图 8.4-4 (b) 撒 述 当 丰 = 1 且 7 值 变动 的 状况 ， 在 此 情况 下 我 们 得 到 一 LUM 锁 
化 滤波 器 。 当 值 递 并 ，xiuwr up 与 xn 值 分 别 趋向 两 端 。 这 样 的 现象 导致 一 递增 的 增强 效应 。 
图 8.4-4 人) 显示 当 1 大 天 二 和 (YY+DA2 的 情况 。 在 这 个 状况 下 ， 可 以 间 时 达到 锐 化 与 滤 除 贬 


(8.4-8) 
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声 的 效果 。 和 参数 大 递增 以 增进 LUM 滤波 器 去 除 脉冲 嗓 声 的 特性 ， 另 一 方面 ,参数 7 控制 着 增 
强 效果 的 级 别 ， 亦 即 人 参数 了 递增， 增强 效果 亦 随 之 增加 ， 反 之 便 随 之 减少 。 





X(b X0 =(N-1+1D XIN-1+D 


(a) LUM 平滑 滤波 器 





X( X0) XIN-1+rD XIN-k+ 1 





0b YX 2 一 [十 分 必 W 一 夺 申 


(c) 混合 平 请 与 锐 化 滤波 器 
图 6.4-4 LUM 让 波 器 的 运作 


此 处 以 一 区 域 性 实例 来 说 明 LUM 波 波 器 的 平滑 及 锐 化 作用 。 设 有 一 10x10 的 图 像 区 
块 ， 其 其 度 值 分 布 如 图 8.4-5 (a) 所 示 。 图 8.4-5 (9 中 以 方 框图 起 的 像素 为 所 加 入 的 脉冲 型 
嗓 声 ， 线 段 则 为 边缘 所 在 位 置 。 将 此 区 块 用 一 个 5x5 的 模板 滑动 违 盖 , 参数 上 =5 及 !=6 的 
LUM 波 器 运算 后 ， 其 结果 如 图 8.4-5 (b) 所 示 。 由 图 8.4-5 (b) 中 可 看 出 ， 原 本 存在 的 脉冲 型 
噪声 经 运算 后 已 被 平滑 化 ， 同 时 了 边缘 特 性 也 被 加 强 ， 亦 部 边缘 所 在 位 置 的 像素 的 灰 度 值 差 
上 被 扩大 。 





人) 运算 前 的 10x10 图 像 区 块 
图 8.4-5 LUM 滤波 器 的 区 域 运 算 实例 ( 待 续 ) 
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~ 全 (Ln 二 





仙 ) 经 运算 后 的 10x 10 图 像 区 块 
图 8.4-5( 续 ) 


习 题 


. 考虑 一 个 二 值 (binatry) 图 像 ， 其 中 1 代表 物体 ，0 代表 背景 。 试 提出 二 判 算法 ， 分 别 用 来 


决定 其 四 连通 及 八 连通 物体 : 


,考虑 图 8.4-5 所 示 的 图 像 ， 如 果 要 以 像素 聚 类 成 长 法 来 执行 分 割 ， 则 像素 种 子 、 相 他 性 及 


停止 条 件 该 如 何 来 选取 ? 


. 将 图 8.4-5 人 b) 去 掉 外 围 的 二 行 及 二 列 以 形成 &x8 的 图 像 惩 阵 ， 对 此 新 图 像 ， 重 复 上 一 题 


的 问题 。 


. 试 以 边界 追踪 法 找 出 上 一 题 的 图 像 的 边界 。 

. 重复 上 题 但 改 以 梯度 大 小 倘 值 法 。 

. 试 以 拉 氏 边界 检测 法 找 出 图 8.4-5 (8) 的 图 像 的 边界 . 

. 重复 上 题 但 先 以 适当 的 LUM 滤波 器 处 理 后 再 进行 边界 的 寻找 。 与 上 一 题 的 结果 比较 并 讨 


论 之 。 
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图 像 分 割 形成 区 域 之 后 ， 所 形成 的 分 割 像素 的 集合 通常 是 用 适合 于 计算 机 进一步 处 理 的 
形式 给 予 表 示 和 描述 的 。 通 常 表示 一 个 区 域 有 两 种 方式 : 中 利用 它 的 外 部 特性 ( 它 的 边界 ) 
表示 区 域 ;或 者 @ 利用 它 的 内 部 特性 (组 成 区 域 的 像素 的 性 质 ) 来 表示 。 选 定 一 种 表示 方式 后 ， 
接 下 来 就 根据 所 选择 的 表示 来 描述 区 域 。 例 如 一 个 区 域 可 以 用 它 的 边界 来 表示 ， 而 边界 是 用 
诸如 它 的 长 度 这 一 类 的 特征 去 描述 。 通 常 当 所 关切 的 重点 是 形状 特征 时 ， 选 择 外 部 表示 ; 当 
所 关切 的 重点 是 如 色彩 和 纹理 等 性 质 时 . 则 选择 内 部 表示 。 无 论 如 何 , 作为 描述 子 (deseripton 
所 选择 的 特征 应 该 对 大 小 、 平 移 和 旋转 等 变化 不 统 感 ， 以 方便 以 后 自动 识别 。 


9.1 ”表示 方法 


9.1-1 链 码 


链 码 (chain code) 是 用 一 个 由 商定 长 度 和 方向 的 直线 段 所 连接 成 的 序列 来 表示 一 个 边界 
的 方法 。 这 种 表示 的 典型 方法 是 以 线段 的 4 或 8 连通 性 为 基础 。 每 个 线段 的 方向 用 如 图 
9.1-1 所 示 的 数字 方法 来 编码 。 


性 


2 才 全 一 人 4 才 一 一 一 10 
| 二 | 忆 
了 5 看 
(9 四 方向 介 ) 八方 向 
图 9.1-1 链 玛 


数字 图 父 通 常 是 用 网 格 方式 来 表示 和 和 处理 的 ， 网 格 在 x 和 ?7 方向 上 等 间 阴 。 所 以 链 码 可 
以 如 此 产生 : 沿边 界 给 连接 每 一 对 像素 的 线 茹 指定 一 个 方向 。 图 9.1-2 (a] 显示 一 个 链 码 产生 
的 结果 。 首 先 从 左上 到 右 下 的 扫描 顺序 找到 第 一 个 边界 点 ， 接 着 按 顺 时 针 方 向 寻找 下 一 个 边 
界 点 ， 找 到 后 就 得 一 个 链 码 ， 依 此 方式 继续 找 出 其 他 链 码 ， 直 到 回 到 第 一 个 边界 点 时 才 停 止 
链 程 的 产生 

假使 我 们 只 需要 比较 粗 咯 地 描述 边界 即 可 ， 以 节省 储存 空间 或 处 理 时 间 ， 则 可 做 网 格 重 
新 取样 ， 再 进行 链 码 的 产生 ， 如 图 9.1-2 (b) 所 示 。 
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链 码 : 0066760776635766543453 链 码 :0676644442211 
5344532231221111T11 
(ai 原始 链 码 伯 )} 新 链 码 
图 9.1-2， 产生 链 码 的 例子 


9.1-2 直线 段 近似 


我 们 可 用 直线 段 近 他 一 个 物体 的 边界 ， 其 训 近 程度 可 根据 设 定 的 临界 值 加 以 控制 。 有 一 
个 简单 的 直线 段 近似 法 如 图 9.1-3 所 示 ， 其 中 4 至 如 的 曲线 最 后 由 4D 、DPC 、(C 瑟 及 配 线 
段 所 近似 。C 、 卫 及 五 这 三 个 折 点 是 如 何 选取 的 呢 ? 首先 形成 4 好 线段， 则 C 点 是 离 此 线段 
上 离 最 远 者 , 若 此 上 离 超过 某 个 临界 值 , 则 此 C 点 为 折 点 。 设 此 习 点 确实 为 折 点 , 则 形成 4C 
及 BC 线段 ， 此 时 石 与 忆 点 分 别 是 与 这 两 个 线段 距离 最 远 首 ， 凡 是 距离 超过 临界 值 者 又 再 被 
设 为 折 点 ， 依 此 类 推 ， 直 到 没有 任何 距离 超过 临界 值 时 才 停 十 。 车 此 曲线 为 封闭 曲线 ,， 则 4 
与 引 点 可 选择 为 曲线 上 相 上 最 远 的 两 点 。 





图 9.1-3 ”以 直线 段 逐 渐 逼 近 曲 线 的 示意 为 


我 们 可 以 直线 段 做 曲线 的 逼近 ， 自 然 也 可 以 用 抛物 线 或 其 他 更 高 次 的 多 项 式 函 数 来 远 
近 ， 其 目的 是 获得 较 平 滑 的 近似 结果 。 下 一 书 介 绍 一 种 这 样 的 谴 近 。 


- 196 - ”数字 图 像 处 理 
9.1-3 召 - 样 条 曲线 拟 合 (B-Spline Curve Fitting) 


有 时 工程 师 常用 称 为 样 条 (spline) 的 细 杆 ,把 经 过 各 已 知 点 的 平滑 曲线 拟 合 在 一 起 。 因 
此 样 条 一 词 亦 适 用 于 数学 上 的 曲线 所 合同 题 。 
设 一 曲线 可 表 成 某 一 函数 /0 ， 其 忠生 xs 了 。 假 设 [a. 菇 被 下 列 各 点 分 隔 成 子 区 间 


在 二 区 福光 执 天 二 直 (9.1-1) 


试 在 各 子 区 间 [8-b z%L 上 ， 以 一 多 项 式 Po) 来 近似 7 。 各 于 区 间 可 以 用 不 同 的 多 项 式 . 但 
必须 把 相连 区 和 间 上 所 用 的 多 项 式 拟 合 在 一 起 ， 使 所 得 的 函数 可 微分 二 次 。 著 所 用 的 多 项 式 不 
超过 三 次 ， 则 将 各 多 项 式 拟 合 在 一 起 所 得 的 函数 称 为 三 次 糙 条 数 (cubic spline)j. yon 的 三 
次 样 条 逼近 必须 满足 下 列 条 件 ; 


1 Pzi)= xD 了 二 012 他 .1-2) 
2. 在 各 区 间 [5- 2 上 ， Po 均 有 形式 

已 (对 = qi 十 相关 二 和 天 士 吧 和 了 一 2 人 .1-3) 
3. PE=y(o， 己 雪 = 广 加 (9.1-4) 
4. 为 了 接合 点 的 平滑 性 ， 需 有 

己 人 =PoOth 巨人 Po rs=Poato) 人 (9.1-5) 


其 中 = 042… 下 一 1 

由 条 件 2 知 共有 4m 个 未 知 数 待 求 ， 而 由 其 他 条 件 可 得 (+TD+2+3-TD=4 个 线性 独 
立 的 方程 式 ， 赦 P(x) 可 以 有 惟一 解 。 如 果 有 一 接合 处 的 位 置 有 所 改变 ， 则 P(m 仍 可 有 惟 一 
解 ， 但 是 此 解 可 能 与 上 一 个 解 有 很 大 的 出 人 。 换言之 只 要 有 一 个 接合 点 起 变化 ， 就 会 改变 整 
个 近似 曲线 的 形状 ， 因 而 难以 作 局 部 修正 。 些 外， 还 有 数值 计算 上 不 稳定 的 驴 能 .因此 在 许 
多 实际 的 应 用 中 都 用 一 种 称 为 B- 样 条 (B-spiine) 的 特殊 函数 以 避免 上 述 癌 题 。 

一 个 经 过 归 一 化 的 无 阶 B- 样 条 函数 写成 Btrl ,其 中 = 012,.… 歼 天 =12,…- 此 函数 可 
用 下 列 迭 伐 方式 产生 


tr 一 并 ) 奋 ea (9 上 + { 二 se 加 如 ] 届 as- (2 





了 (= 一 ， 天 一 2.3… (9.1-6a) 
Jek-L 一 ie 
1 其 下 关 袜 
刀 ( 苛 去 改 其 他 (9.1-6b) 


图 91-4 显示 了 一 些 B- 样 条 函数 。 这 些 函 数 有 非 负 的 值 而 且 只 在 衣 限 区 间 内 (finite 
supporb 不 为 零 。 事 实 上 ， 对 于 归 一 化 的 B- 样 条 ，0 天 六 :和 1 且 不 为 霍 的 区 间 为 Po, 六 ,本 。 
8 tnD 函数 构成 在 逐 自 多项式 函 数 的 空间 中 的 基底 。 人 参数 直 控 制 曲 线 连 续 或 平滑 的 程度 , 例 
如 站 =3， 则 样 条 是 一 个 逐 段 的 二 次 多 项 式 ; 上 =4 则 为 三 次 多 项 式 . 


第 九 章 ”表示 与 描述 -19?- 





吾 1 已 af) 
常数 一 次 
1 一 1 
名 和 1 下 如 和 1 壮 
忌 300 
二 次 
34 
宫 划 君 + 和 3 


9.1-4 ” 阶 次 为 k=1,2,3,4 的 归 一 化 日 - 样 条 函数 
设 接合 点 相 上 为 等 间隔 ， 即 


3 (9.1-7a) 
则 所 有 子 区 间 都 有 相同 的 基底 函数 ， 此 时 BuxtD 可 由 Bot 的 平移 获得 ， 即 
有 OO 有 ex 六 了 = 天 一 | 天 下 一 天 十 ] (9.1-7b) 


恕 果 Ax =1 而 且 选 取 六 为 正 整数 ， 则 以 大 = 3 为 例 可 画 出 如 图 9.1-5 所 示 的 如 ;CD 。 表 9 1- 
则 列 出 Beo, =12.34 的 函数 。 


有 3 





图 9.1-5 己 s( 函数 


由 图 9.1-5 中 隔 看 出 ， 在 一 个 子 区 间 内 ， 例 如 [xz z] = [3,.4] 中 ， 所 用 的 所 合 多 项 式 通常 是 
数 个 (此 处 为 3 个 ) 样 条 函数 的 组 合 ， 即 


PN =ao 记 CD+T 凶 有 3(D+ 2 有 六:( (9.1-8) 
其 中 家 ) 了 一 012， 为 待定 的 常数 系数 。 
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也 
二 ， 0sr<i 
2 
一 区 2 一 宪 
已 (= 到 十 3 一 1.3， 了 袜 x<2 
二 G-z) 2 xc<3 
0， 其 他 


由 于 B- 样 条 函数 形成 的 函数 Po) 在 每 个 子 区 间 上 最 多 由 大 个 B- 样 条 函数 来 决定 . 而 B- 
样 条 基底 将 数 本 身 只 在 大 个 子 区 间 内 不 为 等， 因此 有 局 部 的 特性 。 亦 即 改 变 像 (9.1-8) 式 中 的 
任何 系数 ww ， 只 改变 天 个 于 区 间 曲 线 的 形状 。 另 外 , 三 次 的 3- 样 条 函数 也 具备 连续 的 一 阶 与 


表 9.1-1 四 个 B- 梓 条 函数 
思 自拔 妆 | 
屯 ，( 本 = 2 一 如 1 工 生 区 区 2 
0， 其 他 


| 闪 


-| 


人 允 1r 对 | 一 林 一 属 


(一 妇 ”， 





定 


二 阶 导 数 ， 因 此 所 形成 的 痒 条 曲线 也 非常 平滑 . 


9.1-4 区 域 的 骨架 


一 个 平面 区 域 的 下 架 (skeleton) 可 用 来 代表 其 形状 结构 ， 例 如 人 及 丽 龙 的 骨架 照片 反应 


出 两 者 截然 不 同 的 形状 。 


我 们 常用 中 轴 变 搞 (medial axis transformation，MAT) 来 定义 -- 个 区 域 的 上 骨 课 。 一 个 边界 
为 召 的 区 域 丸 的 MAT 定义 如 于 : 对 于 在 丸 中 的 每 个 点 已 . 寻找 在 站 点 中 与 其 最 近 的 点 (根据 
欧 几 里 德 或 其 他 距离 量 测 )， 若 最 近 的 点 在 一 个 以 上 ,， 则 属 于 咏 的 中 轴 (骨架 )， 图 9.1.6 显 


示 以 欧 岂 里 德 距离 为 量 测 方式 求 一 MAT 的 例子 。 





图 9.1-6 


直接 用 MAT 的 定义 去 找 MATF 需要 付出 极 高 的 计算 代价 考虑 一 个 WeN 的 像素 扎 阵 ， 


两 个 简单 区 域 及 其 中 轴 (以 惠 线 表示 ) 


(一 3 生生 12 和 7 一 12x 十 中， 


人 -24 +607-44)， 


避 达 X<1 


1 过 并 雯 之 


了 之 工 性 了 


3 扫 关 二 站 


其 他 
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计算 量 (计算 距离 的 次 数 ) 为 (六 -2 (4 ,所 以 有 一 个 CCOV ) 的 计算 复杂 度 - 因此 我 们 较 常 
采用 称 为 细 化 (thinning) 的 方法 ， 在 下 列 条 件 限 制 下 ， 反 复 去 除 -- 物 体 的 边缘 点 : 由 不 可 去 
除 端 点 ; 志 不 可 破坏 连通 性 ; 号 不 可 造成 边缘 过 度 腐蚀 。 

以 于 介绍 一 个 针对 二 值 化 区 场 的 细 从 方法 。 设 1 代表 区 域 ，0 代表 背景 : 考虑 一 个 边界 
点 证 太 其 8 连通 的 点 ， 如 图 9.1-7 所 示 。 首 先 判断 至 少 有 一 个 8 连通 为 0 的 边界 点 是 否 要 删 
除 ， 而 判定 该 删除 的 条 件 如 下 (必须 同时 满足 ): 

















(D 2 二 N(p)<6 | | 二 | 
(2) SCP2)=1 

G] 忆 pm =0 {9.1-9) 囊 k 和 4 
(4 PPB65 Ps = 一 0 上 大 | 








先 9.1.7 乌 的 仓 近 点 的 示意 闭 
媳 
其 中 六 (站 为 玉 的 非 零 相 邻 点 的 个 数 , 即 N( 站 = 2 记 ， 而 SCp) 为 PP 记 PP 的 顺 


这 


序 中 0 到 1 转变 的 次 数 。 被 判定 为 该 删除 的 点 暂 不 删除 ,组 是 要 加 以 记录 。 等 所 有 边界 点 都 
被 判定 完 后 ， 再 一 口气 将 所 有 该 删除 的 点 删除 。 接 下 来 考虑 第 二 阶段 的 删除 步骤 ,其 中 介 
与 (2) 的 删除 条 件 与 上 一 阶段 相同 ， 但 (3) 与 (4) 则 改 成 


(3 刁 3， 疡 Pr 一 昌 
(4) PP6 Ps = 站 


同 第 一 阶段 ， 判 定 要 删除 的 点 只 是 加 以 记录 而 暂 不 删除 ， 等 最 后 同时 删除 .反复 执行 第 
一 与 第 二 阶段 的 程序 ， 直 到 都 没有 任何 可 删除 点 为 止 ， 最 后 剩 下 没有 被 删 除 的 点 就 是 所 要 找 
的 骨 架 。 

条 件 (1) 中 的 目的 在 于 防止 端点 Cw( 站 = 归 被 删除 ， 或 区 域 锌 过 度 腐蚀 (w(P)= 了) -其 他 
条 件 也 都 各 有 其 原因 ， 此 问题 留 做 习题 。 


9.2 边界 质 述 于 


9.2-1 形状 数 


在 9.1 节 中 曾 担 到 链 码 是 一 个 可 用 来 表示 边界 的 方法 ， 但 是 它 并 不 适合 作为 物体 的 描述 
和子， 因为 它 显 然 对 于 旋转 的 变化 极为 敏感 、 亦 即 同 一 物体 旋转 不 同和 印度 时 ， 可 能 会 得 到 两 组 
截然 不 网 的 链 码 。 尽管 如 此 ， 若 对 链 码 进行 某 些 归 一 化 的 处 理 ， 所 得 的 码 仍 有 可 能 成 为 描述 
子 ， 形 压 数 (shape tumben 即 为 其 中 一 例 。 

给 一 个 四 方向 的 链 码 ， 方 向 数 定 义 成 差分 链 码 中 数值 最 小 者 。 方 向 数 的 阶 次 二 刚 是 指 其 
数字 的 个 数 而 言 . 此 外 对 一 封 奢 的 边界 .= 必 为 偶数 。 两 个 相 邻 四 方向 链 码 数字 ; 与 j 的 差分 
链 码 数字 4 是 指 


(9.1-10) 
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人 = (1+ 有 mod 4，0 委 让 安 3 (9.2-1) 


图 92-1 显示 ”=6 的 方向 数 的 形成 ,其 中 在 形成 差分 链 码 时 是 把 链 码 视 为 头 尼 相 接 的 环 
形 序 列 。 如 果 将 图 9.2-1 的 图 形 旋转 90 度 ， 可 发 现 其 差分 链 码 不 会 改变 ， 显 示 差 分 链 码 对 旋 
转 不 敏感 。 当 然 旋 转 对 本 身 就 是 差分 链 码 之 一 的 方向 数 也 不 会 有 影响 。 


本 加 
本 


方向 数 ，033033 
图 9.2-1 阶 方向 数 的 形成 


以 上 的 方 回 数 配 合 以 下 讨论 的 格 点 方向 归 一 化 处 理 ， 获 得 对 大 小 、 平 移 和 旋转 均 不 敏感 
的 实用 描述 子 。 考 虑 图 9.2-2 所 示 的 物体 边界 。 首 先 以 两 个 相 上 最 远 的 点 的 连 线 方向 作为 主 
轴 ， 如 图 9.2-2 中 的 虚线 所 示 。 找 一 矩形 ， 其 边 对 淮 主轴 方向 ， 其 大 小 恰 能 把 所 有 边界 包括 
在 内 。 将 图 9.1-1 (a) 的 四 方形 链 码 转 一 角度 使 其 数字 “0” 所 指 的 方向 与 主轴 的 方向 ~ 一致。 要 
获得 = 阶 方向 数 ， 可 考虑 所 有 正 整数 Ni 与 刀 使 得 a12= Ni +N ， 且 N, AN 最 接近 矩形 长 
对 离 的 比例 。 例 如 图 92-2 中 , m = 14， 此 时 (CN,N)J=t6)、(25) 或 (3.4)， 其 中 (3.4) 最 符合 
物体 边界 的 拖 形 的 长 宽 比 例 ， 故 选 思 =3，N = 4。 所 对 应 的 链 码 、 差 分 链 码 及 方向 数 亦 显示 
于 图 少 2-2 中 。 


| 





Frrrerrrrrrrr 
DOgD 昌 DO 


方向 数 : 00300303103313 





图 9.2-2 方向 数 产生 的 过 程 


9.2-2 ”傅立叶 描述 子 


一 个 区 域 的 周边 为 一 封闭 曲线 。 设 以 参数 方程 fr (9), ys)} 来 表示 此 曲线 ， 其 中 参数 * 为 
相对 于 曲线 上 -个 起 始点 Ex0)，XO) 的 沿线 弧 长 。 设 忆 代 表 此 区 域 的 局 长 ， 则 xs) 与 y(9 各 
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可 视 为 局 期 为 忆 的 周期 函数 ， 即 xs)= x+ 局 ，yG)= Js+Pjvs 。 若 进一步 将 图 像 平面 
看 成 复数 平面 且 表 示 成 z=x+i， 则 区 域 周 边 变 成 一 个 复数 的 周期 函数 ， 即 


ZX39)= zs+ 书 (9.2-2) 
对 其 以 复数 博 立 针 级 数 展 开 可 得 
xf5) 一 了 Zene 
丰 = (9.2-3) 


1 2igyP 加 
2 = 上 zfsye2mk77d5， 大 一 小 土 1 土 2 ，…， 


环 即 为 边界 的 情 立 叶 描 述 子 (下 ourier descriptor，FD)y。 由 于 我 们 实际 上 面 对 的 是 离散 的 点 ( 设 
为 za ,zw…p2w)》， 因 此 将 人 9.2-3) 式 变 成 六 点 的 离散 傅立叶 变换 


名 (9.2-4) 


其 中 "=01 六 -1 六 通常 选 为 2 的 滋 千 ， 如 此 FFT 可 用 来 加 快运 竺 速度 。 若 舍 去 部 分 
丈 的 高 频 系数 , 对 其 重建 问 来 的 点 集合 1 } 所 形成 的 边界 外 形 不 会 有 太 大 的 改变 , 因此 选取 
少许 的 去就 可 用 来 区 别 外 形 不 同 的 物体 。 

么 实际 上 会 随 物 体 平移 、 旋 转 等 动作 而 改变 ， 但 是 其 改变 是 有 规律 是 可 预测 的 ， 例 如 物 
体 旋转 一 个 角度 9、 则 整个 五 都 会 乘 上 ee ， 其 他 动作 所 造成 的 改变 如 表 9.2-1 所 示 。 


衷 9.2-1 人 情 空 叶 灼 述 闻 的 一 些 性 质 


动 作 边 界 傅立叶 描述 子 
旋 转 ze Ze 

平 移 z + (Ar 十 这 轨 人 +(Ar+ 这 5 
大 小 妇 z 立 己 

起 始点 改变 z Z ee 


9.3 区 域 描述 子 


9.3-1 一些 简 单 描述 子 


有 一 些 与 区 域 有 关 的 简单 描述 子 如 下 : 
厚度 (thiclmess): 让 此 区 域 消 失 所 需 最 小 的 腐 钾 次 数 。 
最 大 弦 (maximum chord)， 连结 边界 上 相 臣 最 远 的 两 点 所 形成 的 线段 。 
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最 小 绝 (minimum chord): 与 最 大 弦 垂 直 的 一 个 线 外 ,其 长 度 与 最 大 弦 的 长 度 所 形成 的 邱 
形 恰 能 将 整个 区 域 转 住 。 
直径 (diameteD: 最 大 弦 的 长 度 - 
延展 度 (elongatiom: 最 大 弦 与 最 小 弦 的 长 度 比 。 
泽 度 与 所 采用 的 腐蚀 方法 有 关 。 此 参数 大 致 上 是 平移 与 旋转 不 变 的， 但 是 随 区 域 大 小 比 
倒 的 改变 而 变 。 一 个 骨架 型 的 区 域 与 一 个 图 形 区 域 ， 显 然 在 厚度 上 会 有 明显 的 不 同 。 延 屡 度 
这 个 特征 可 用 来 区 别 较 细 长 的 物体 与 较 方 正 或 圆 形 的 物体 。 





9.3-1 拓 朴 属性 


括 朴 的 形状 属性 (topological shape atttibutes) 是 形状 的 一 种 特性 , 它 是 指 一 物体 经 由 樟 皮 
极 变 挽 {frabber-sheet transform) 后 ， 其 特性 仍然 不 变 . 这 种 橡皮 板 变 换 可 以 想像 成 将 一 图 虱 类 
位 称 皮 板 一 样 拉 长 ， 图 像 内 的 物体 也 随 着 图 像 被 拉 长 而 产生 空间 上 的 形变 . 作 此 变换 时 不 允 
许 切 割 物 体 或 任意 连结 物体 - 

在 前 述 这 种 拓 朴 属性 的 描述 下 ， 上 距离 观念 很 明显 地 不 属于 拓 朴 属性 ,办 在 拉 长 橡皮 板 的 
过 程 中 距离 早已 产生 蛮 化 。 另 外 . 水 平和 季 直 的 观念 也 不 属于 拓 朴 的 性 质 ， 国 在 变换 中 并 不 
考虑 物体 是 否 有 旋转 的 效应 - 

接 下 来 我 们 机 讨论 的 是 ,在 图 像 中 物体 的 组 成 数 C 与 物体 中 的 润 数 互 间 有 一 基本 的 关系 ， 
我 们 称 之 为 万 拉 数 (Euler numbem， 其 定义 如 下 

=C- 瑟 (9.3-1) 
尤 拉 数 也 是 一 种 拓 朴 特性 ， 因 为 C 和 瑟 都 有 拓 朴 属性 ， 

不 规则 的 物体 能 以 它们 的 括 村 特性 来 描述 。 首先 我 们 引进 本 壳 (cenvex hull 与 非 凸 状 
(convex deficiency) 这 两 个 名 词 。 所谓 凸 壳 是 指 拉 长 橡 应 板 中 包围 橡皮 板 的 部 分 称 为 凸 壳 . 非 
凸 状 又 分 为 湖 状 (lakes) 与 堤防 状 (bays) 两 种 ; 湖 状 是 指 完全 被 物体 包围 住 的 区 域 . 坦 防 状 是 
指 物体 与 凸 壳 周边 所 包围 的 区 域 。 我 们 将 上 述 名 词 用 图 9.3-!1 所 示 的 例子 来 说 明 。 在 有 些 应 
用 中 ， 以 凸 起 的 概念 来 描述 物体 比 直 接 描述 物体 更 简单 。 


湖 


图 9.3-1 蝶 示 点 起 概念 的 一 个 例子 
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9.3-1 距离、 周 长 、 面 积 的 测量 


假设 有 二 点 (mm ) 与 fm ma ) ， 二 点 间 的 距离 有 以 下 儿 种 表示 式 : 
fl1) 欧 几 里 了 德 (Euclidecan) 距离 


1 [wm (9 
G@) 大 小 (magnitude) 工 离 

dv =jm 一 m|+ 人 一 吕 | (9.3-3) 
G) 最 大 值 tmaximum value) 蝶 离 


ds 一 aaxftlmn 一 丰 四 一 如 [9.3 


接 下 来 我 们 所 探讨 的 周 长 与 面积 只 针对 二 值 区 像 才 有 意义 。 

一 个 物体 的 周 长 是 指 : 在 物体 的 边缘 上 由 任 一 点 开始 围绕 着 耽 缘 回 到 起 始点 的 总 像素 个 
数 。 而 一 个 物体 包围 的 面积 是 指 : 物体 边缘 内 的 总 像素 和 ， 其 中 包括 所 有 0 与 1 的 点 。 

Gray[1971] 曾 提出 一 个 有 系统 的 方法 来 计算 二 值 图 像 物体 的 面积 与 周 长 . 他 的 做 法 是 利 
用 一 组 二 值 的 样本 区 像 来 与 所 求 的 区 像 作 比 对 ， 就 可 轻易 地 经 由 比 对 的 结果 来 表示 所 求 图 像 
的 面积 与 周 长 。 

我 们 现在 考虑 2x2 点 像素 的 样本 图 像 称 为 四 位 元 组 (bit quads) ， 如 图 9.3-2 所 示 。 经 由 
比 对 图 像 与 叫 位 元 组 的 结果 我 们 可 分 别 求 得 其 面积 及 局 长 如 下 : 





(1) 面积 

BOJ+2nfG.jr3ntoJ+4nfOj+2nt2o 03.3) 
@) 周 长 

只 =n@J+nteJ+nei+2n2n 9.3. 


其 中 zf{ 台 代表 图 像 与 样本 图 像 驯 比 对 吻合 的 个 数 . 

建立 距离 、 周 长 . 面积 这 些 参 数 后 ,我 们 就 可 以 开始 对 一 物体 的 几何 属性 做 探讨 . 首先 
我 们 先 假设 在 图 像 中 物体 的 数目 远大 于 洞 的 数目 ， 也 就 是 互 = C. 

在 上 面 的 前 提 下 ， 我 们 可 定义 出 似 国 性 (cireularity) 


_ 4 
(有 
如 果 是 一 个 图 形 的 物体 . 它 的 似 圆 性 会 刚好 等 于 1， 其 余 物 体 的 亿 贺 性 都 将 小 于 1. 


一 幅 锅 像 内 如 果 包 含 许 多 物体 ， 但 只 有 俏 许 的 洞 ， 也 就 是 如 同 前 面 的 假设 五 = C， 我 们 
可 推导 出 每 个 物体 的 平均 周 长 及 面积 。 





人 3- 六 


心 
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图 9.3-2 用 来 比 对 的 样本 图 你 


平均 面积 : 4 =- 血 各 .3-8) 


平均 周 长 ，P， -之 (9.3-9) 


如 果 图 像 崔 包 合 疗 长 的 物体 (例如 手写 字 )， 我 们 也 醋 求 其 近似 的 平均 长 度 及 宽度 - 
半 均 长 度 : 工 ， -过 (9.3-10) 


平均 宽度 ; 刺 ，= 2 





(9.3-11) 
以 上 这 些 简单 的 测量 对 于 识别 图 像 的 整体 特征 非常 有 用 。 
9.3-4 空间 甜 
在 概率 论 中 ， 对 于 连续 函数 /zx 妨 ， 其 伙 + 门 阶 丰 (momenb 定义 为 
Mu =| | meat (9.3-12) 
其 中 天 = 042,…。 而 中 心算 (central moment 则 定义 为 


pr= 人 人 Ge=-O- 歼 Foy)dxdy (9.3-13) 
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其 中 节 与 了 分 别 为 x 及 了 的 期 望 值 。 

一 个 与 平面 区 域 有 关 的 几何 特性 像 是 大 小 . 位 置 、 方 向 及 形状 等 ， 其 中 很 多 特性 与 乍 这 
个 参数 有 关 。 在 概率 论 中 , 符 用 来 呈现 概率 密度 函数 的 特性 ， 例 如 期 望 值 是 一 阶 矩 ， 方 差 及 
协 方差 是 二 阶 的 中 心 所 等 。 在 这 里 我 们 沿用 相同 的 定义 ， 但 是 将 概率 密度 函数 换 成 是 二 维 二 
值 图 像 的 图 形 。 一 个 二 值 图 像 失 mm 四 区 域 的 人 + 六 阶 宇 定义 成 


af -村 宁 etarbm 四 {9.3-14) 
把 8 站 的 成 灰 度 图 像 六 ma 站 的 定 六 也有， 但 是 其 物理 意义 将 不 再 是 几何 参数 。 例 如 一 个 
概率 密 诬 函数 /mm 的 零 阶 第 代表 的 是 该 函数 所 含 盖 的 体积 ， 而 对 区 wm, 站 而 言 则 变 成 我 们 
所 感 兴趣 的 面积 ， 也 就 是 区 域内 所 含 像素 的 个 数 。 
在 定义 过 2 人 me, 的 矩 后 ， 同 理 可 定义 其 中 心算 如 下 


邮 ~]1 交 -1 


Hi = (和 一 (一 四 Bt 站 (9.3-15) 


腊 =0 1 


其 中 








点 仁 , 习 称 为 重心 (center of gravity) 或 质心 (centroidJ)。 若 一 般 卸 为 已 知 ， 则 中 心 矩 的 计算 可 
通过 一 般 矩 来 达成 ， 例 如 
As = 寻 
Ac =zo=0 
lo = 一 Xi (9.3-169) 
Ai = 好 Ji 


二 阶 的 中 心 抵 的 许多 特性 相当 于 概率 论 中 的 协 方差 捉 阵 ， 以 及 力学 中 物体 旋转 的 转动 惯量 。 
此 协 方差 矩阵 为 


rr 同 iu (9.3-17) 
和 上 0 


对 角 化 后 ， 可 求 出 对 角 和 矩阵 


巨 TU = 从 (9.3-18) 
其 中 


BT 62 
-| 2 | (9.3-19) 
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县 矩阵 吾 的 行 向 景 为 五 的 特征 值 向 量 ， 另 外 


_|4 日 9 3 
4-| 辣 (9.3-20) 


含 隐 的 特征 值 。 注 意 到 (9.3-18) 式 与 (4.8-10) 式 有 相同 的 含义 。 从 (9.3-17) 式 可 得 其 特征 伪 为 





1 了 3 
4 一 了 Ga 十 Aioz) 二 Vs 二 oa 一 so 十 4 





， ， (9.3-21) 
4 = 了 Gaao + oz) 一 忆 Ja3s 十 js 一 并 0zo 十 4 
则 区 域 的 方向 角 可 表示 成 
0 | 一 ao | (9.3-22) 
上 
此 外 、 一 个 区 域 的 离心 素 (eccentrnicity) 可 定义 成 
or 吕 .3-23 
和 


此 参数 与 比例 大 小 及 方向 无 关 ， 只 与 形状 有 关 - 

由 于 Hos = Mo 为 区 域 的 面积 ， 故 可 作为 区 域 大 小 的 量 测 。 并 可 以 此 来 求 得 一 个 归 一 化 
的 和 矩 ， 而 获得 一 个 与 比例 大 小 无 关 的 描述 。 由 人 @9.3-13) 式 可 推 得 ， 对 一 除 上 比例 因子 VC 的 
函数 Jo/VE,pAVE)， 其 中 心 矩 为 re 的 中 心 矩 的 (人 & 六 所 倍 . 因 为 1 为 面积 ， 故 可 将 
Vuss 视 为 此 比例 因子 ， 因 此 可 得 归 一 化 的 中 心 矩 为 





AL 


1 = 一 一 一 (9.3-24) 
Wo 
由 归 一 化 的 第 二 与 第 三 阶 惩 可 导出 下 面 七 个 不 蛮 邦 (fmoment invariant); 
由 = 十 Poa (9.3-25) 
外 =(7o 一 和 二 4 (9.3-26 
丰 =( 人 ee 一 37) 二 (3 一 7 (9.3-2 及 
包 一 (13o 十 入) 二 (772 十 3 (9.3-28) 


各 = 人 一 3 二 故人 -30 7 
+ 372 -3 + 3 太一 GO + (9.3-29) 
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不 =( 人 (7 一 7 )m 十 太 3) 一 人 :1 二子 3 六 ] 
4 03 士 作 2 十 7o3) 人 (9.3-30) 


名 = G7 一 帮 J0Ds ai[Gpo + 一 30 + 矶 7] 
十 (92 一 入 十 73 )[3,。 十 六 > 六 一 (23 二 73 ) ] (9.3-3 引 ) 


此 组 不 变 矩 不 受 平移 、 旋 转 及 大 小 比例 改变 的 影响 (Hu[1962])， 稍 后 有 人 注意 到 这 些 不 变 矩 
的 动态 范围 有 时 会 很 大 .因此 建议 采用 iog 必 | (Hsial1981): 若 4 的 正 负 号 很 重要 ， 则 用 
sgn|p jlogl| - 

不 变 矩 对 二 维 物体 识别 非常 有 用 ， 曾 有 人 用 在 飞机 识别 上 (Dudani 等 人 [1977D)， 也 曾 被 
推广 到 三 维 物体 的 识别 上 (了 eeves 与 Taylor[1989])， 还 被 用 来 决定 医学 图 像 中 三 维 结构 体 的 
方向 (Faber 与 Stokilyf[1988]). 不 过 要 注意 的 是 这 些 不 变 矩 并 不 足以 区 别 所 有 形状 ,而且 对 噪 
声 很 敏感 。 


9.3-$ 级 理 组织 


纹理 组 织 ftexture) 是 另 一 种 描述 区 域 的 重要 方法 : 一般 天 然 纹理 组 织 较 具 随机 性 ， 而 人 
造 的 则 较 有 规律 或 是 有 周期 性 。 通 常 我 们 采用 像 细 致 与 粗糙 程度 、 对 比 程 度 、 方 向 特性 及 规 
则 性 来 描述 纹理 组 织 。 所 有 描述 的 方法 大 致 可 分 成 三 种 : 统计 法 、 结 构 法 及 变换 法 (或 频谱 
法 )。 具 有 随机 特性 的 纹理 组 织 很 适合 用 统计 法 ， 例 如 将 其 以 随机 场 (random field) 描述 : 续 
构 法 在 于 描述 基本 图 像 原始 结构 (image primitive) 的 排列 组 合 ， 例 如 以 排列 规则 的 平行 线 来 
描述 一 丝 理 组 织 。 变 换 法 或 称 频 谱 法 是 利用 傅立叶 变换 的 性 质 ， 试 图 找到 频谱 中 能 量 集中 的 
罕 频 谱 以 检测 出 纹理 组 织 的 周期 性 。 
量 统计 法 

(1 自 相 关 函 教 (autocorrelation funetion，ACF) 

从 某 个 角度 来 看 ,纹理 组 织 与 基本 图 像 单元 的 大 小 有 关 . 亦 即 比较 大 的 基本 图 像 单元 相 
当 于 比较 粗糙 的 纹理 组 织 ， 反 之 则 代表 比较 细密 的 纹理 组 织 。 

Jom 站 的 自 相 关 孙 数 定义 成 


r(m 梧 =》 》 DGOa + 下 (9.3-32) 


其 中 峙 < 玫 且 上 < 瑟 . 而 瑟 及 五 为 正 值 常数 。 若 基本 图 像 单 元 比较 大 . 其 ACF 随 着 距离 增 因 
{ 即 上 虹 与 |7 变 大 ) 而 缓慢 衰减 ， 反 之 则 总 减 较 快 如 果 所 磁 到 的 纹理 组 织 有 空间 上 的 周期 性 , 
虽 ACF 也 会 起 起 落落 呈现 辕 期 性 。 

ACF 缓慢 衰减 相当 于 其 “扩散 育 ” 或 “宽度 ” 较 宽 ， 因 此 一 个 描述 纹理 组 织 粗糙 程度 的 
方式 是 量 测 ACEF 的 “宽度 ”或 “扩散 度 "， 其 中 一 个 测量 法 是 由 Faugeras 与 Pratt[1980] 所 提 
册 的 扼 生 成 函数 
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Mi》 》 的 一 有 首位 一 用)r(zo 阿 {9.3-33) 
其 中 
1 = 》 mr(m 站 1 =》 人 pn 问 (9.3-34) 
在 所 有 4，， 中 通常 用 df20、 02、 af 1 及 afz。 
(2) 边缘 密度 


一 个 纹理 组 织 的 粗糙 程度 也 可 以 用 边缘 像素 的 密度 来 表示 。 所 请 边缘 密度 是 指 在 单位 面 
积 内 边缘 像素 的 平均 个 数 ， 可 表 成 


1 了 丘 ， 
Dr 站 = 机 CEI 之 之 2 十 六 下 十 大) {9.3-33) 


其 中 27+1 与 居 +1 为 观察 视窗 的 大 小 ， 而 


.，、_ |， 者 为 边缘 像素 
en 必 不 为 边缘 像素 


G) 二 阶 中 心 矩 
二 阶 中 心 矩 ( 亦 即 方差 o) 对 于 纹理 组 织 的 描述 格外 重 昌 ， 例 如 一 个 纹理 组 织 的 相对 平 
滑 性 马 表 未 成 


{9.3-36) 


1 
1+d? 


R=0 代 表 6: =0， 亦 即 灰 度 强度 完全 一 致 的 区 域 。 若 寻 很 大 则 灵 趋 近 于 1。 

{) 其 度 共 同 出 现 

一 般 直 方 图 是 对 单一 像素 的 个 别 其 度 值 统 计 ，、 此 处 则 是 考虑 一 对 像素 的 灰 凑 人 午 所 形成 的 
直方 图 , 因此 得 到 的 是 一 个 二 维 的 直方 图 ， 可 写成 ji, 廊 , 其 中 了 与 了 代表 有 某 个 相关 位 置 的 
两 个 像素 的 个 别 灰 度 值 ，A 万 则 代表 具有 此 种 关系 的 像素 对 的 个 数 。 将 直方 图 8 万 除 上 
总 数 得 到 记 ，， 它 可 视 为 全 放 对 的 联合 概率 密度 的 一 个 估 测 。 由 忆 , 组 成 的 惩 阵 严 ={P，}， 
称 为 灰 度 共同 法 现 (co-occurrence) 或 相依 (dependency) 卸 阵 。 

我 们 举 一 例 来 说 明 产 矩阵 的 形成 。 设 一 图 像 的 灰 度 只 有 12 三 种 。 考 虑 一 个 Sx5 的 图 
像 如 下 


有 如 =| 一 





(9.3-37) 


II 区 一 
li 富 己 一 
一 Ia 世 一 一 
hi 定 
kt 一 上 一 疡 
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傻 设 所 考虑 的 位 置 关 系 是 第 二 个 像素 在 第 个 像素 右 下 方 且 相 邻 ， 则 jz 六 所 形成 的 矩阵 可 
写成 


二 kh 
呈 上 Mo 
二 全 0 


总数 共计 16 个 ， 故 矩阵 妃 为 


178 17/38 3716 
178 174 0 
17/16 4716 1716 


在 上 述 的 例子 中 所 选择 的 位 置 关系 对 - 43? (或 135") 有 相同 灰 产 的 纹理 组 织 会 特别 敏感 
(max(P 一 174 可 视 为 一 敏感 度 的 指标 ), 选 取 不 同 的 位 置 关系 可 用 来 检测 具有 不 同 特性 的 纹 


万 = 








理 组 织 . 
从 矩阵 瑟 中 可 获得 以 下 几 个 纹理 组 织 的 特征 ， 
最 大 几 率 : max(P,y ) (9.3-38a) 
丰 阶 差分 矩 : > > 作 一 站， (9.3-38b) 
了 
能 量 的 均匀 性 : 3 》 忆 2 (9.3-38o 
1 1 
丧 : 一 2 Pu IlogPi (9.3.38d) 
利 结构 法 


在 纹理 组 织 的 结构 模型 中 ， 纹 理 组 织 被 看 成 是 由 较 小 的 基本 原始 结构 依 某 种 规则 排列 组 
合 而 成 . 因此 要 描述 一 个 纹理 组 织 必 须 措 述 此 原始 结构 及 其 置 放 的 法 则 。 原始 结构 可 依 灰 廊 
形状 及 均 勾 性 来 设计 ， 置 放 法 则 可 采用 周期 性 、 邻 接 性 及 最 近 下 离 等 观念 来 设计 。 

Catlucci[1972] 建 议 用 线段 与 移 边 形 当 诛 始 结构 ， 而 置 放 方 法 则 用 像 图 形 一 般 的 语言 来 措 
述 。 Zucker[1976a，1976b] 则 把 真实 的 纹理 组 织 想 成 是 某 个 理想 的 纹理 组 织 的 失真 变形 。Lnu 
与 Fu[1978] 则 采用 树 状 说 言 文法 结构 .其 他 方法 可 见 Tonmita 等 人 [1982] 以 及 Leu 与 Wee[1985T 


e@ 频谱 法 


像 丰 煤 细致、 方向 等 纹理 组 织 的 特征 均 可 用 傅立叶 频谱 来 佑 测 。 由 于 纹理 组 织 的 粗糙 
程度 与 其 空间 上 的 周期 {spatial period) 成 正比 、 故 对 有 较 粗 糙 的 纹理 组 织 的 区 域 ， 其 傅立叶 
频谱 能 量 集 中 在 低频 上 :， 反之 较 细 致 的 区 域 的 频谱 能 量 会 集中 在 较 高 频 的 地 方 。 另 外 由 最 主 
要 的 频谱 峰值 的 位 置 可 看 出 纹理 组 织 图 样 的 主要 方向 。 
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9.4 “形态 学 


形态 学 (momphology) 的 重点 是 研究 一 物体 的 形状 或 结构 . 也 可 说 是 探讨 一 物体 内 部 之 问 
的 相互 关系 : 在 语言 学 的 领域 里 ， 形 态 学 是 指 对 字 词 结构 的 一 种 研究 ; 而 在 生物 学 中 形态 学 
则 与 生物 或 有 机 体 的 形状 有 关 。 例 如 抽 寿 叶 的 形状 可 用 来 准 认 檀 物 ， 又 如 由 细菌 的 菌 从 可 分 
办 其 种 类 等 。 

在 数字 妈 像 处 理 的 应 用 领域 中 ， 我 们 亦 沿用 形态 学 这 个 名 词 . 但 为 了 与 其 他 应 用 领域 有 
所 区 别 ， 故 有 有 人称 为 数字 形态 学 (digifal morhology) 或 数学 形态 学 (fmathematical 
motphoiogy)。 称 数字 形态 学 是 因为 处 理 数字 周 像 的 原故 ， 称 为 数学 形态 学 则 是 因为 必须 用 到 
数学 的 概念 ， 特别 是 有 关 集 含 论 (set 由 eory) 方面 的 数学 . 

本 节 主 要 是 介绍 数学 形态 学 中 的 几 个 概念 。 虽 然 有 些 概念 ， 如 一 个 区 域 的 骨架 及 边民 等 
在 先前 的 章节 中 已 提 到 过 ， 但 是 浊 处 我 们 将 在 形态 学 这 个 统一 的 理论 结构 下 ， 对 其 重新 再 探 
讨 . 我 们 将 探讨 二 值 图 像 的 形态 学 。 

图 9.4-1 中 所 取 的 图 像 设 为 妃 ， 将 妃 的 3x3 矩阵 与 处 理 的 结构 元 素 ? 作 肥 辑 送 算 得 一 输 
出 点 - 到 一 新 的 3x3 抢 阵 重复 上 述 步 骤 。 如 此 一 直 取 完 输 大 图像， 这 样 就 完成 了 处 理 过 程 . 
整个 过 程 像 是 求 二 维 的 卷 积 . 不 同 的 结构 元 素 与 逻辑 运算 对 图 像 有 不 同 的 效应 、 我 们 先 做 一 
些 术语 上 的 定 久 ， 再 从 最 基本 的 腐蚀 (erosiom 以 及 用 胀 rdilatiom) 这 两 种 运算 讨论 起 ， 


结构 元 喜 


输出 图 像 








国 9.4-1 形态 学 操作 想像 国 


设 集合 中 与 3 分 别 含 元 素 训 = 亿 必 与 3= (ss ， 其 中 书 与 % ji=1.2 分 别 代表 整数 的 
坐标 轴 位 置 。 定 义 吾 平移 (ranslation) x=(x ,zi) 单 位 (表示 成 (Ba 为 


(有 ,={elae=5+x 对 于 be 寻 (9.4-1 
定义 3 的 反射 或 卫 像 (reffection) (表示 成 &) 为 
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=f|x=-9 对 于 re 人 (9.4-2) 


定义 集合 吾 的 补 全 (complement) 为 


及 一 低 |x& 且 (9.4-3) 
最 后 定义 集合 吾 与 3 的 差 (dfference) 为 
再 一 汪 = 信 [CE 再， 7 (9.4-41) 


和 腐 名 (Erosion) 
这 是 一 种 从 物体 的 边界 上 ， 将 物体 往 内 收缩 若干 像素 的 方法 ， 其 数学 表示 为 


区 = 四 白 5= 人 (9).c 如 (9.4-5 
昌 膨胀 (Dilatiom) 
与 腐蚀 相反 的 操作 ， 将 物体 的 边界 往外 及 胀 若干 像素 的 方法 ， 其 数学 表示 为 
万 = 及 四 SS= 他 (人们 门 8z 纪 (9.4-6] 


图 9.4-2 是 表示 腐蚀 及 膨胀 对 一 幅 图 像 所 可 能 造成 的 结果 ,其 中 虚线 代表 原 图 像 的 边界 ， 
可 看 出 经 腐蚀 过 程 后 原 物 体内 缩 ， 而 膨胀 是 向 外 扩张 。 这 两 个 基本 步骤 很 重要 ， 因 为 往 后 的 
处 理 都 是 联合 使 用 或 交互 使 用 这 两 个 步 玫 。 





fa] 原始 二 值 图 像 





(b) 腐 独 的 结果 (c) 膨胀 的 结果 
图 9.4-2 腐 烛 六 膀 胀 对 图 像 的 影响 
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志 断 开 (Opening) 
定 尽 为 
好 sg3=({ 且 名 人 四 9 (9.4-7) 
意思 是 说 先 腐蚀 再 膨胀 ， 或 是 重复 腐蚀 直到 消除 掉 所 有 不 想 思 的 点 或 线 ， 再 用 膨胀 恢复 原 图 
形 。 这 样 的 步 又 可 用 来 消除 物体 边界 外 的 小 分 枝 二 扰 ， 或 者 用 来 修剪 物体 客 余 的 小 分 枝 ， 
鲁 闭合 (Closing) 
定妆 为 
BaS=(B 田 但 5 (9.4-9) 
这 与 断 开 是 相反 的 操作 ， 即 先 膨 胀 再 腐蚀 。 与 上 面相 同 也 可 重复 使 用 ， 但 要 注意 在 恢复 图 像 
时 ， 廊 联 过 几 次 ， 收 缩 就 需 几 人 次。 在 过 程 中 ， 我 们 可 用 来 将 在 物体 内 的 小 洞 补 同 ， 或 是 修补 
二 端点 之 间 的 缺口 、 细 长 的 缺口 ， 连 结 断 线 等 。 
图 9.4-3 显示 一 个 断 开 与 闭合 的 例子 ， 其 中 所 用 的 结构 元 素 8 为 一 小 圆 盘 . 从 图 9.4-3 的 


(到 (e) 可 发 现 ， 其 实 (e) 的 边界 可 由 小 图 盘 $ 贴 着 下边 界 内 洲 动 的 3 的 边界 所 形成 : 同 理 
全 的 边界 可 由 8 贴 着 吾 边界 外 滚动 的 8 的 边界 所 形成 。 


人 





图 9.4-3 断 开 与 半 合 的 图 形 展示 { 待 续 ) 
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四 全 
图 3.4-3 ( 续 ) 


和 收缩 (Shrinking) 


重复 使 用 腐蚀 的 续 巧 ， 直 到 线 宽 都 仅 剩 单 像素 的 大 小 时 为 止 . 常用 在 计算 整 幅 图 像 中 物 
体 的 总 数 ， 例 如 有 人 把 它 用 在 石棉 纤维 的 计数 上 。 


昌 细 化 (Thinning) 
也 是 重复 使 用 腐蚀 的 技巧 ; 但 确保 物体 的 连通 性 不 被 损坏 。 通 常 采用 两 个 步骤 : 中 事先 


标示 要 移 除 的 像素 ; 岛 在 不 破坏 连通 性 的 情况 下 将 岂 的 候选 像素 消除 。 细 化 可 以 将 所 感 兴趣 
的 物体 缩小 到 只 有 单 像 素 宽 ， 如 此 呈现 出 物体 的 形状 - 


和 @ 骨 化 (Skeletonizatiomy 


肯 化 非常 类 但 细 化 ， 但 其 结果 并 不 相同 ， 骨 化 可 由 9.1- 4 节 中 轴 变 换 来 定义 。 这 种 作法 
有 以 下 几 点 好 处 : 

吕 不 会 删除 端点 

包 删除 的 点 不 会 中 断 连接 ; 

念 不 会 过 度 腐蚀 。 


昌 厚 化 (Thickening) 
这 是 和 绝 化 相反 的 操作 , 出 重复 使 用 朵 胀 所 得 的 结果 。 与 细 化 相同 的 是 以 两 个 步骤 完成 ; 


要 注意 的 是 不 可 与 周围 的 物体 相合 并 。 图 9.4-4 是 一 个 形态 学 的 应 用 实例 ， 其 目的 是 通过 追 
踪 后 找 出 断 点 。 
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一 人 《人 人 
ra -er _ ev - 一 
加 Ra 
本 、 : ah 和 we 好 Eeeaaad 
ta) 原始 印 届 版 电路 的 图 像 人 b) 将 原始 图 中 的 电路 抽取 出 来 (9) 闭合 的 结果 ， 将 节点 中 的 小 洞 修补 
省 7 人 
竹 一 -~ Le 一 ” 要 
站 3 机 
和 者 和 世人 加 几 帮 
才 一 se 
(由 腐蚀 再 膨胀 的 结果 ， 最 后 留 下 节点 (e) 骨 化 后 的 结果 介 追踪 后 的 结果 
圈 9.4-4 
习 题 


(下 


. 为 何 要 选 定 对 大 小 、 平 移 及 旋转 等 变化 均 不 敏感 的 找 述 子 ? 
. 找 出 所 有 阶 次 为 8 的 形状 及 其 方向 数 。 

, 对 一 个 圆 取 直线 近似 的 结果 会 是 什么 ? 

. 证 明 三 次 的 B- 样 条 函数 有 连续 的 一 阶 与 二 阶 导 数 。 

. (HD 写 一 程序 根据 MAT 定义 找 出 一 区 域 的 中 轴 或 肯 哥 。 


(2) 以 实际 程序 执行 的 时 间 佑 测 其 计算 复杂 度 。 


，(9.1- 人 与 @.1-10) 式 中 所 列 的 各 个 条 件 有 何 意 义 ? 
(1) 以 9.1 节 所 提供 的 方法 写 一 细 化 程序 。 


(2) 以 实际 程序 执行 的 时 间 估 测 其 计算 复杂 度 。 
6G) 此 细 化 的 结果 一 般 是 否 会 与 MAT 定义 出 的 骨架 相符 ?为 什么 ? 


. 证 明 表 9.2-1 所 示 的 傅立叶 描述 子 的 性 质 。 
. 下 面 这 两 种 区 域 ， 你 可 以 用 何 种 简单 的 区 域 描述 子 加 以 区 别 ? 


10. 分 别 找 出 下 面 两 个 字 的 凸 壳 及 蛮 状 与 堤防 状 的 非 凸 部 分 。 
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中 原 


11. 举 二 个 二 值 图 像 为 例 分别 进 行 9.3-3 节 所 示 的 各 种 量 测 结果 。 
12. 对 以 下 四 物体 以 程序 或 手 算出 其 前 二 个 不 变 矩 ( 即 血 及 各) 


其 中 的 数字 代表 像素 个 数 ， 比 较 并 讨论 其 结 
13. 设 一 图 像 有 0,1,2.3 四 种 灰 度 值 。 考 虑 一 个 8x8 全 的 国信 下 





和 1 2 301 2 3 

3 DO 1 2 3 站 1 了 

2 30 1 2 30 1 

1] 2230 1 2 3 0 

0 1Ll 2 30 1 2 3 

3 0 1230 1 > 

2 3 0 1 2 3 0 1 

1 2 30 1 2 3 0 
设 位 置 关 系 为 “第 一 个 像素 在 第 一 个 像素 的 左上 方 昌 相 邻 "， 试 求 其 共同 出 现 矩阵 及 其 最 
大 概率 。 

14. 对 下 列 的 图 像 卫 与 结构 元 素 8 执行 各 运算 ; 

(D 腐蚀 4 
(2) 及 胀 
(3) 斯 开 - 
人) 闭合 本 
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本 书 的 最 后 一 部 分 为 图 像 模 式 识 别 ， 局 于 整个 数字 图 像 处 理 的 高 层 处 理 部 分 (如 第 八 章 
图 8.0-1 所 示 )。 这 个 过 程 很 类 似 于 一 般 用 智 营 认 知 这 一 术语 所 指 的 过 程 。 一般 实际 的 图 像 模 
式 识别 系统 ， 都 针对 其 应 用 对 象 有 特别 的 “领域 知识 ”或 解决 方案 ， 而 很 难 有 一 个 可 解决 众 
多 不 同类 问题 的 通用 图 像 模式 识别 系统 。 然 而 ， 有 一 些 基本 原理 或 原则 、 对 多 数 的 图 像 模 式 
识别 系统 均 适 用 ， 本 章 的 主要 目的 就 是 讨论 这 些 基本 原理 。 


10.1 分 类 


图 像 模式 与 图 剧 模 式 类 别 


图 像 模式 (pattem) 可 以 说 是 我 们 日 常生 活 当中 获取 信息 的 主要 形式 ， 只 要 睁 开眼 睛 ， 放 
有 最 所 及 的 东西 都 可 视 为 图 像 模 式 ， 例 如 每 天 读书 看 报 所 接触 的 文字 就 是 一 个 很 标准 的 图 像 模 
式 。 另 外 五 线 谱 上 的 音符 、 化 学 结构 的 表示 式 以 及 心电图 等 也 都 是 。 

同样 ， 只 要 我 们 睁 开眼 睛 ， 就 会 不 自觉 地 执行 图 像 模 式 识 别 ， 便 如 我 们 可 轻易 状 认 出 
家 人 及 亲朋 好 友 并 叫 出 其 姓 各 我 们 是 如 何 做 到 的 ?用 电脑 如 何 来 模拟 我 们 这 种 天 生 的 能 力 ? 
显然 必须 先 具 备 抽取 图 像 模 式 的 特征 (feature) 的 能 力 ， 再 根据 这 些 特 征 来 区 分 不 同 的 区 像 
模式 类 型 。 

图 像 模式 可 以 是 一 组 量 测 或 观察 的 结果 ， 它 可 以 用 定量 或 定性 的 方式 来 描述 ， 甚 至 也 可 
用 回 量 或 矩阵 来 代表 。 一 般 而 言 ， 图 像 模式 是 由 若干 个 像 第 九 章 中 所 述 的 撒 述 子 所 形 或 。 例 
如 ,不 变 矩 的 撒 述 子 可 写成 下 列 向 量 


中 =[ 钠 各 外 由 央 多 加 下 (10.1-]) 


上 述 向 量 称 为 特征 向 重 (feature vecton。 对 不 同 物体 形状 的 图 像 模式 ， 其 特征 向 量 通常 会 有 显 
著 的 不 同 ， 但 对 同一 形状 物体 的 旋转 ， 庆 天 及 第 个 版 的 特征 丫 量 而 言 尘 入 玛 相 近 ， 这 就 是 图 
像 模式 分 类 的 一 个 依据 。 
多 分 类 器 的 设计 

分 类 噬 的 设计 理念 与 图 像 模式 类 别 的 特性 息息相关 。 当 图 像 模 式 类 别 是 依照 点 名 查 表 的 
方式 对 号 人 座 时 ， 则 此 分 类 器 的 设计 就 变 或 单纯 的 模版 比 对 (template matehing)。 例 如 有 固定 
大 小 的 26 个 英文 字母 为 模版 ， 输 入 一 个 未 知 的 图 像 模式 直接 比 对 就 可 知 其 为 哪 一 个 英文 字 
萨 ， 当 然 先决 条 件 是 输 人 的 字 几 乎 不 能 有 任何 的 失 走 ， 否 则 比 对 会 有 困难 。 当 图 像 模 式 是 依 
照 有 某 种 共同 的 特性 组 成 一 类 时 ， 分 类 器 设计 的 重点 变 成 是 检测 及 处 还 这 些 共同 的 特征 。 一 
般 而 言 ， 对 于 一 个 图 像 模式 差异 程 魔 大 的 图 像 模式 识别 问题 ， 这 个 设计 理念 比 简单 的 模版 比 
对 好 ,因为 储存 特征 通常 比 直接 储存 比 对 图 像 模式 有 较 小 的 储存 需求 ， 而 卫 处 理 起 来 比较 快 
速 ， 也 有 较 咨 的 失真 容忍 度 。 

一 般 来 说 ， 分 类 器 将 对 每 一 输入 向 量 计算 出 一 个 对 应 的 教 值 ， 而 此 数值 将 会 指出 此 输入 
图 像 模 式 属 于 邬 一 个 类 别 。 大 多 数 的 分 类 器 决策 规则 都 被 简化 或 一 个 临界 值 规则 ， 这 个 临界 
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值 将 测试 空间 分 割 为 数 个 不 连续 的 空间 ， 其 中 每 个 空间 区 域 分 别 代表 不 同 的 单一 类 别 。 如 果 
特征 右 量 落 在 茶 一 特定 区 域 上 ， 则 此 物体 将 会 被 归 类 成 某 一 特定 对 应 类 别 ， 

在 建立 分 类 器 基本 决策 规则 之 后 ， 就 必须 找 出 区 分 各 类 别 的 特定 临界 值 。 一 般 做 法 是 使 
用 一 群 已 知 其 类 别 归 属 的 特征 样本 来 训练 分 类 只 ， 这 样 的 一 群 特征 样本 称 为 训练 集 (training 
seb。 训练 集 是 由 一 些 预先 精确 分 类 ， 选 自 不 同类 别 具 有 各 类 别 代 天 性 的 样本 所 组 成 。 训 练 集 
逐步 调整 决策 平面 (decision surface)， 使 分 类 器 在 训练 集中 作用 时 正确 率 为 最 大 。 

考虑 图 10.1-1 所 示 的 一 个 分 类 状况 ， 此 处 共有 两 类 ( 即 “Y” 与 “和 ”)， 每 个 图 像 模式 
的 特征 都 被 表示 成 一 个 二 维 的 特征 向 量 x=[x，x: 工 ， 被 画 成 一 个 “V ”或 “4 "。 图 中 时 线 
的 方程 式 是 = 六 ， 因 此 其 分 类 工作 可 转变 成 使 用 一 个 决策 函数 (x) = 冯 -为 ， 而 其 决策 法 
则 是 以 零 为 临界 值 , 即 若 D(z) >0, 则 此 x* 属 于 “Y” 这 一 类 , 若 D(z) <0 则 此 x 属 于 “4” 
这 一 类 。 





10.1-1 一 个 简单 的 分 类 器 设计 


分 类 器 所 用 的 决策 函数 De) 该 如 何 通 过 训练 集 来 决定 呢 ? 这 里 介绍 一 个 简单 的 选 代 
法 。 假 设 有 两 个 训练 集 分 属于 二 个 不 同 的 类 别名 与 几 。 设 已 ( 妇 代 表 第 天 次 迭代 时 所 获得 的 
决策 函数 ， 且 


厂 ( 贡 三 村 (10.1-2) 


其 中 必 为 第 下 次 迭代 时 的 权重 向 量 ， 避 为 第 大 个 输 人 向 量 。m 是 任 选 的 初始 权重 向 量 。 在 
第 上 次 时 的 训练 法 则 如 下 


钊 =W TeX， 车 wii S0 上 且 和 人 节 
Ht 一 We 基 0 且 XeUo， {10.1-3) 
II 三 隅 5 其 化 情况 


其 中 e 为 一 正 值 修正 增 量 。 简 言 之 ， 若 分 类 错误 则 改变 权重 向 量 ， 使 决策 平面 改变 ， 和 否则 决 
策 平面 维持 不 动 。 此 训练 法 对 于 像 图 10.1-1 这 种 所 渭 线 性 可 分 离 的 情况 保证 收敛 ， 换言之 在 
有 限 次 的 训练 次 数 下 ， 终 将 使 训练 集中 的 所 有 向 量 分 类 正确 。 
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10.2 ”统计 决策 图 像 模式 识别 


10.2-1 基本 理论 


在 实际 图 像 模式 识别 的 问题 中 ， 由 于 每 个 类 别 中 的 图 像 模式 极 不 可 能 有 单一 的 特征 向 量 
值 ， 而 是 一 段 范围 内 的 值 而 每 个 图 像 模式 的 特征 值 会 落 在 该 范围 的 某 个 点 并 无 法 精准 预知 ， 
甚至 所 谓 的 明确 数值 范围 也 未 必 可 知 。 对 于 这 种 具有 随机 特性 的 问题 ， 以 概率 的 概念 来 描述 
极为 适合 。 

设 某 一 个 图 像 模 式 x 来 自 m 类 的 概率 为 plo, | x) 。 另 外 假设 一 个 分 类 器 判定 某 个 图 像 模 
式 来 自 o@, ， 但 事实 上 它 来 自 m 所 造成 误 判 的 损失 为 上 。 因 此 ,将 图 像 模式 x 归 类 为 类 别 @， 
的 平均 损失 为 


Pi( 阅 = 》 Pt| 2 010.2- 切 
其 中 对 为 类 别 总 数 。 上 式 又 可 改写 成 
1 上 
Pi(o = 柯 名 PCx1oDP(on) (10.2-2) 


其 中 P(xzios) 为 上 类 别 的 图 像 模式 往 率 密度 函数 Po,) 刚 是 出 现 m 类 的 概率 , 由 于 (10.2-2) 
式 中 的 共同 系数 pf 与 类 别 无 关 ， 对 类别 的 判定 无 影响 ， 因 此 可 删除 ， 于 是 (1042-2) 式 变 成 


Pi( 如 = 之 巧 pw)P(oD (10.2-3) 


决策 时 ， 对 一 输 和 人 图像 模 式 x 计算 所 有 的 平均 损失 Pi (xj, pa (xz ,ovw(z) ， 并 选择 具有 
最 小 平均 损失 的 类 别 当 做 的 归属 。 此 种 分 类 器 称 为 贝 氏 分 类 器 (Bayes classifier)。 

若 分 类 正确 时 损失 为 0， 而 分 类 错误 时 的 损失 都 是 固定 值 (与 类 别 无 关 )， 合 如 设 为 1， 则 
西 可 写成 1- 6 ， 因 而 (10.2-3) 式 可 简化 成 


庆 
Pi(m=2》 -JPpZosJPou) 
上 =1| 


= 吕 ( 一 避让 (10.2-4) 
于 是 页 氏 分 类 器 在 下 列 条 件 下 会 将 图 像 模 式 x 归 类 为 凶 
以 一 局 | 大) ONJ< 天 一 局 | 区) 站 (OO 《10.2-3) 


或 


有 六 | 的 JP) > 富 | 人) 了 =12 (10.2-6) 
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因此 具有 0 ~ 1 失真 损失 的 贝 氏 分 类 器 相当 于 采用 决策 函数 
已 (z) = 中 世 | 四) 门 忆 OO) 了 =]12 4 (102- 人 7 
来 做 分 类 。 
10.2-2 ”高 斯 图 像 模式 类 别 的 贝克 分 类 器 
在 (10.2-7 式 中 ,需要 p(x|oj) ， 即 第 /7 类 的 x 的 概率 密度 分 布 。 最 常见 的 是 高 斯 分 布 
] 1 T mm-l 
plo)= 贡 册 E 矶 是 -em ， Ce-m (10.2-8) 


其 中 n 为 特征 向 量 的 维度 ，, 与 C, 分 别 为 第 /类 图 像 模式 的 平均 向 量 与 协 方差 算 阵 。 在 此 
情况 下 ， 比 较 简便 的 决策 函数 是 


DiG9=mpcelo)Po) 
-IaPlo)- 二 in2r- 了 InlC， 1-Kz -mrC2Ge-m (10.2-9) 


其 中 in2r 与 类 别 无 关 ， 玖 可 洛 略 。 另 外 ， 若 Plo,) = -7 ， 即 机 会 均等 ， 则 (10.2-9) 式 可 进 
一 步 简化 成 


Di(=-3m1Ci1-3kz-m 和 Cnz-m 中 =12… ME (102-10) 
若 所 有 协 方差 扼 阵 又 都 一 样 ， 即 记 = C,7 = 42 ， 则 可 再 简化 成 

Di 四 =zrCAm -CT ， 7 =12 【10.2-11) 
若 又 进一步 ， 吕 = 了 (单位 逢 阵 )， 则 

Di(9= rm -了 mm， 了 =12…，a (10.2-12) 


我 们 可 证 明 (10.2-12) 式 为 最 短 距离 分 类 器 (minimum distance ctassifienm、 此 证 明 留 做 习题 。 所 
亩 最 短 距离 分 类 器 是 指 计算 x 至 各 类 别 平均 向 量 忆 ;的 离 最 近 者 将 * 归 类 至 该 类 。 


10.3 ”特征 选取 


在 图 像 模 式 识别 的 问题 中 ， 我 们 常 需要 在 众多 可 利用 的 特征 中 选取 适当 者 以 供 分 类 器 应 
用 。 特 征 选 取 的 问题 受到 许多 文献 的 广泛 讨论 ,但 是 并 没有 明确 的 答案 。 
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事实 上 ， 对 于 特征 的 选取 并 没有 太 多 可 供 遵 循 的 准则 . 一 般 来 说 ， 本 质 上 有 用 的 特征 都 
是 任 借 颠 观 来 选取 的 。 以 下 依 序 列举 了 少数 较 佳 的 特征 。 

1. 区 别 性 (discriminatiom): 对 于 属于 不 同 分 类 的 样本 来 说 ， 其 特征 应 含有 不 同日 具有 意 
义 的 值 。 以 第 八 章 图 8.1-2 所 举 的 水 果 特 征 空间 为 例 ， 直 径 是 一 个 很 好 的 特征 。 

2. 可 菲 性 (reliability): 对 于 所 有 则 一 分 类 的 所 有 样本 来 说 . 特征 应 其 有 类 做 的 值 : 例如 ， 
闫 色 对 于 分 辨 苹果 的 成 部 度 来 说 可 能 不 尽 理想 ,也 就 是 说 ， 即 使 一 个 青 萤 果 和 一 个 红 萤 果 (成 
束 的 苹果 ) 属于 同样 的 种 类 ， 但 以 颜色 特征 来 说 却 有 不 同 的 值 。 

3 独立 性 (independence]j: 这 是 说 所 使 用 的 特征 间 应 该 彼此 屯 不 相关 。 例 如 直径 和 重量 
就 梅 成 高 度 相关 的 特征 ， 因 为 重量 几乎 正比 于 直径 的 立方 。 

4. 数目 小 (smail numbers): 图 像 模式 识别 系统 的 复杂 度 随 其 维 数 (使 用 特征 的 数目 ) 增加 而 
快速 增加 。 更 重要 的 是 ， 训 练 分 类 器 与 评估 其 效率 所 需 的 样本 数 随 特 征 数 增加 而 呈 指 数 增加 。 

如 上 所 述 ， 我 们 一 直 在 寻找 一 小 组 可 车、 独立 且 具 辨认 力 的 特征 .一 般 来 说 、 我 们 期 户 
分 类 器 的 效率 在 有 用 的 特征 被 期 除 时 能 随 之 下 降 ， 以 此 验证 某 些 特征 的 有 效 性 。 另 外 ， 去 除 
高 频 噪 声 与 高 相关 性 的 特征 可 以 改善 分 类 器 的 效率 。 

特征 选取 可 以 看 成 是 去 除 某 些 特征 及 结合 其 他 相关 的 特征 ， 直 到 特征 集 变 成 易于 管理 而 
将 能 仍 足 够 的 过 程 . 在 以 下 的 讨论 中 , 我 们 将 考虑 一 个 将 二 个 特征 减 为 一 个 特征 的 简单 问题 - 
人 很 设 有 一 个 含有 好 个 类 别 样本 的 训练 集 ， 设 ,为 第 站 个 类 别 的 样本 数 巨 ， 目 第 ;个 样本 在 类 
别 7 中 做 判断 时 所 得 的 特征 为 和 入 。 

接 下 来 ,我们 开始 计算 各 类 别 中 每 个 特征 的 平均 值 


六 = 一 (10.3-0 


一 (10.3-2) 


js 与 局 上方 的 ^ 记 号 表示 是 以 训练 集 所 产生 类 别 平均 值 的 估 测 ， 而 非 真正 类 别 的 平均 值 。 
类别 7 中 特征 * 的 估 测 方差 为 


上 


6 = 二 六 (rn 0103.3) 
局 ， -! 


辐 理 ， 特 征 ?的 估 测 方差 为 
1 这 
C -让 玄 0， 一 屿 ) (10.3-4) 


参 特征 相关 性 
类 别 / 中 特征 x 及 了 的 相关 性 可 由 下 式 估 测 


第 十 章 ”图 像 模式 识别 -223- 


帮 


1 A 。 
过 一 上 JJ 一 此 ) 
站 了 二 

6。= 一 一 一 一 -一 一 一 - (10.3-5 


Or 9 


6。 的 值 被 限制 在 - 1 与 于 之 问 ， 若 为 零 值 则 表示 二 特征 不 相关 。 若 为 接近 于 + 1 的 值 则 表示 
具有 高 度 相 关 人 性 。 若 值 为 - 1 则 表示 其 中 一 个 特征 变量 与 另 一 特征 变量 的 负数 成 比例 。 若 这 
个 值 的 大 小 接近 ! 则 表示 两 个 特征 或 许可 以 结合 为 - -， 亦 或 其 中 之 -- 可 以 去 除 。 

$ 类 别 相隔 的 上 离 


好 的 特征 可 使 类 别 间 容 易 被 区 分 ， 一 个 衡量 特征 区 分 两 个 类 别 能 力 的 指标 称 为 经 方差 归 
一 化 后 的 分 类 平 汐 值 间 的 距离 。 以 特征 x 来 说 ， 其 定义 如 下 








。 请 -PA 

中，= -一 -一 (10.3-6) 
6 +G2 

光 处 两 个 分 类 分 别 为 了 和 志 显然 此 蝶 离 愈 大 愈 好 。 

包 降低 维度 


有 许多 方法 可 将 特征 x 和 ?结合 为 单一 特征 > 一 个 简单 方法 是 将 z 与 ? 以 某 个 比例 加 以 
组 合 的 线性 函数 


己 一 0 十 四 ) 【10.3- 力 


因为 调整 特征 值 的 大 小 不 会 影响 分 类 器 的 效率 (每 个 输入 图 像 模式 都 做 相同 的 调整 )， 我 们 可 
以 对 调整 比例 如 上 限制 ， 例 如 


2 + 本 一 ] (10.3-8) 
将 上 式 并 人 (10.3-77 式 ， 写 成 
=XO08s 晶 +] Sm 【10.3-9) 


此 处 如 标 示 出 x* 与 ?在 2: 中 比例 的 新 变量 。 使 用 时 可 选取 8 使 得 特征 有 最 大 的 类 别 区 分 能 
力 [以 (10.3-6 式 或 其 他 方式 衡量 ]。 


10.4 聚 类 


10.4-1 聚 类 的 定义 


聚 类 (clustering) 的 定 艾 为 对 所 给 予 的 特征 空间 内 的 各 点 ， 将 其 分 成 若干 类 的 分 割 处 理 。 
轨 据 图 像 模 式 的 识别 目的 ， 聚 类 有 时 不 必用 到 复杂 的 算法 。 例 如 .对 印刷 后 的 数字 
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全 2 3 人 做 识别 时 ， 其 类 别 数 10 个 为 已 知 ， 因 此 只 要 以 预先 储存 的 标准 图 像 模 式 来 与 输入 
的 图 像 模 式 做 匹配 即 可 。 而 以 手写 的 10 种 数字 {112,…,9.0} 做 识别 时 亦 相同 . 首先 其 类 别 数 
10 个 为 已 知 ， 利 用 训练 学 习 所 用 的 图 像 模式 ， 在 这 些 图 像 模 式 代表 某 个 数字 可 内 人 判断 的 情 
况 下 ， 找 出 特征 空间 中 各 个 数字 存在 的 范围 及 有 系统 的 查验 法 则 。 而 后 只 要 检查 未 知 图 像 模 
式 在 这 些 标准 空间 属 何 范围 ， 即 可 做 图 像 模式 的 辨认 ， 此 时 亦 不 必用 到 复杂 的 聚 类 方法 。 然 
而 ， 在 以 下 情况 ， 应 用 以 上 所 提出 的 简单 方式 并 不 适合 : 

他 辩 认 对 象 数 为 未 知 。 

人 未 给 予 标准 图 像 模 式 。 

二 同一 类 中 差别 较 大 ， 在 标准 空间 中 ， 其 输入 的 图 像 模式 做 单纯 的 比较 困难 者 。 

在 这 些 情形 下 要 用 到 育 类 的 方法 。 此 方法 将 多 个 图 像 模式 相似 者 分 别 做 汇集 ， 并 分 成 几 
个 群 。 此 种 处 理 过 程 在 图 像 模式 识别 上 是 非常 重要 的 课题 。 

聚 类 算法 要 处 理 以 下 两 个 重要 的 问题 : 

作 事 类 总 数 的 决定 。 

地 训 类 群 的 生成 。 

考虑 图 10.4-1 (a) 所 示 的 情形 ， 如 图 中 所 示 ， 很 明显 可 分 成 2 群 。 接 着 考虑 图 10.4-1 人 b) 
情形 ， 若 以 图 中 虚线 的 方式 裹 类 ， 册 可 用 !1 群 来 包含 所 有 点 ， 若 是 以 图 中 实 线 的 方式 聚 类 ， 
则 可 区 分 成 3 群 ， 至 于 要 分 成 移 少 群 则 要 根据 图 像 模式 癌 的 相 伺 性 做 判断 。 而 于 3 个 群 的 情 
形 时 ， 对 图 中 的 x 而 言 ， 因 其 与 3 个 群 骨 有 耻 离 ， 此 时 其 属 何群 即 成 问题 。 此 种 依 类 问题 是 
较 难 的 问题 。 





群 2 
章 1『 oo 
or 口 ， 
站 间 间 和 
CO 
AQ 口 ， 
人 ta) 简单 情况 fb) 复 杂 情形 
国 10.4-1 图像 模式 聚 类 案例 
10.4-2 聚 类 算法 





本 节 将 介绍 一 些 聚 类 算法 。 设 有 W 个 图 像 模式 的 特征 向 量 忆 ,zxw 卫 于 群 
如 =E2…) 中 二 个 图 像 模式 间 的 工 离 定义 如 下 : 


(图 像 模式 六 及 xx, 间 的 虑 离 )= dx ,xz {10.4-1) 
而 某 一 图 像 模 式 z 与 其 群 人 中 之 间 的 距离 ， 则 设 为 x 与 引 标 准 图 像 模 式 癌 的 距离 ， 并 表示 成 
(图 像 模式 x* 与 群 必 间 的 距离 = dfx ,oo ) 《10.4-2) 
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鳃 最 邻近 (Nearest Neighbor NN) 法 


(1) 设 处 理 时 的 图 像 模式 编号 为 常数 忆 ， 其 初始 值 忆 =1。 
所 形成 的 群 数 设 为 常数 好， 其 初始 值 为 W =1。 
设 *r 为 标准 图 像 模 式 ， 形 成 初始 群 w, : 设 了 为 一 个 小 门限 值 。 
(2》 求 距 离 
da = min fa(xono (10.4-3) 


当局 < 了 时 ，xn, 属 于 具有 da。 的 四 。 
当 d .> 兰 了 时 ，xrs 当 作 标准 图 像 模 式 ， 而 形成 新 群 四 ,，， 并 对 对 值 旭 1。 忆 值 也 
加 1。 
人 ) 已 > 太 时， 执行 结束 ; 否则 回 到 (2)。 
门限 值 工 的 大 小 对 NN 法 聚 类 的 结果 会 有 很 大 的 影响 。 如 图 10.4-2 (a) 所 示 ， 整 体 生 成 4 
个 群 ， 而 在 门限 值 设 大 时 ， 则 如 图 10.4-2 (b) 所 示 ， 所 生成 的 群 数 减 至 3 个 。 


群 o。 群 w， 群 @。 





群 w， 


群 @ 
ta) 了 小 时 ( 群 数 为 少 人 bb) 了 大 时 ( 群 数 为 习 
图 10.4-2 在 NN 法 中 门限 值 了 的 影响 

中 下 最 邻近 (天 Nearest Neighbor 天 -NN) 法 

大-NN 法 与 NN 法 类似 ， 其 步骤 如 下 : 

人 与 NN 法 相同 。 

(2) 求 工 离 了 人 二 了 大好 ) : 

坟 =d(xpsbo) {10.4-4) 


在 2 比 门限 值 了 小 时 ， 售 小 到 大 排序 后 . 至 天 号 群 为 止 ， 将 图 像 模式 xx 重复 归属 
于 上 述 天 个 群 。 已 值 加 1。 
人 G) 与 NN 法 相同 。 
在 玉 NN 法 中 , 某 图 像 模式 x 归属 某 群 情形 则 如 图 10.4-3 所 示 . 如 图 中 所 示 , 在 天 = 3 时 ， 
x 重 复归 属于 mw。,os 与 @w, 三 群 。 因 上 大-NN 法 与 NN 法 相同 ， 亦 受 门 限 值 了 的 大 小 所 影响 ， 故 
必需 要 儿 试 儿 个 了 来 做 聚 类 ， 然 后 采用 最 适合 者 做 处 理 。 
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人 群 标准 图 像 模 式 


已 , 群 标准 图 像 模 式 oz 群 标准 图 像 模式 










群 标准 图 像 模 式 
2 距离 4 < do < 相 <r< 丰 <d 


ao 群 标准 图 像 模式 
驯 . 群 标准 图 像 模式 
图 10.4-3 上 故 NN 法 中 图 像 模式 的 重复 登录 
大 下 平均 (K-imean)] 算法 
此 为 将 群 数 固 定 为 天 个 而 做 宫 类 的 算法 。 其 步 邓 如 下 
(1) 选 定 天 个 适当 的 图 像 模 式 ， 作 为 群 中 ~ or 的 标准 图 像 模式 。 今 
天 =1 ， a = 三 
(0) 当下 式 成 立时 ， 将 图 像 模式 ro 归属 于 群 w 
deso)<d(epo) (10.4-5) 
此 处 ;12 下 
书 值 增 邵 1。 当 已 > W 时 ， 设 已 =1。 
G) 群 w, 的 新 标准 图 像 模式 四 ,是 使 下 式 中 所 示 的 成 本 函数 .7 为 最 小 的 情况 下 所 定 。 


J= 了 emz (10.4-0) 
此 时 的 新 标准 图 像 模式 四 ， 为 属于 群 w 的 全 体 图 像 模式 x 人 @ ) 的 平均 
= 六 碾 xx (10.4-7) 
N 为 属 @ 的 图 像 模式 总 数 。 
(4 对 所 有 的 群 以 G) 求 其 新 标准 图 像 模 式 ， 并 在 与 前 次 标准 图 像 模 式 相等 时 ， 终 止 处 
理 。 否 则 返回 CC)。 
以 天 -平均 算法 ， 对 某 群 由 的 标准 图 像 模式 做 更 新 的 状态 如 图 10.4.4 所 示 。 以 此 方法 所 产 
生 群 的 个 数 固 定 为 扩 个 。 应 多 党 试 不 同 的 六 值 ， 以 选 出 最 适合 的 二 值 。 


ee 





O: 属 群 @, 的 图 像 模式 
争 ， 新 加 入 群 w 的 图 像 模式 
口 : 群 w 的 原 标准 图 像 模式 
四 群 o 的 新 标准 图 像 模式 





图 10.4-4 乒 平 均 算法 中 标准 园 像 模式 的 更 新 
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i0.4-3 ”模糊 聚 类 


在 先前 讨论 的 训 类 观念 中 ,一 个 图 像 模式 会 很 明 允 地 被 指定 属于 某 一 类 ， 不 会 同时 归属 
于 两 个 或 两 个 以 上 的 类 别 。 但 是 我 们 也 发 现在 许多 问题 中 ， 类 别 的 边界 并 不 是 永远 都 是 如 此 
清晰 分 明 , 也 就 是 有 疡 谓 的 灰色 地 带 ， 模 糯 桶 类 (fozzy elustering) 便 是 针对 这 种 观念 所 提出 的 
聚 类 方式 。 在 模糊 聚 类 中 ， 每 一 个 图 像 模式 归属 于 某 一 类 是 以 其 0 到 1 的 数字 代表 其 归属 程 
度 ， 其 中 1 与 0 分 别 代 表 最 高 与 最 低 的 归属 度 。 

模糊 聚 类 的 最 后 结果 是 以 一 个 分 草 给 阵 (partition matrix) 下 来 呈现 


区 = 凶 j12 2 (10.4-8) 


其 中 心 , s [0,]], 代表 图 像 模式 x, 归属 于 第 ; 个 类 别 的 程度 。 此 外 有 两 个 伴随 w, 的 天 然 限制 ， 
首先 是 


220 =1， 对 所 有 了 = 12， 太 (10.4-9) 
另外 一 个 是 
0<》 2 <N， 对 所 有 ;=12,…, 打 (10.4-10) 
Ji 


在 上 一 节 的 天 -平均 (又 称 C- 平 均 ) 聚 类 准则 中 , 是 以 将 (10.4-6 式 的 成 本 函数 最 小 化 的 方式 
获得 群 心 位 置 ， 此 处 则 可 用 如 下 的 成 本 函数 以 及 110.4-9 及 (10.4-10) 的 两 个 条 件 限 制 来 求 


计时 
Jie)= | 一下， >1 (10.4-11) 
it JJ=1 


其 中 mi 为 第 计 群 的 群 心 ，r 称 为 指数 型 权重 ， 此 权重 影响 分 割 矩阵 归属 值 的 模糊 化 程度 。 上 
述 的 问题 是 一 个 典型 的 有 条 件 最 制 的 最 佳 化 问题 ， 解 得 





囊 
六 | = 下 1 2 f10.4-12) 
(0 
了 1 
人 ) 
定 | r-L 
磺 ,， 一 了 
于 Ja 12 2 (10.4-13) 


了 人 Wx， 一 珊 : 各) 去 


以 上 的 结果 是 由 Bezdek[1981] 所 提出 的 模糊 C- 平 均 (izzy C-imearm FCMD 版 本 . 整个 算法 的 步 
又 如 下 : 
(1 选取 群 数 对 人 2 科 李 过 拉 以 及 指数 型 权重 r (1<r<eo) 。 选 取 一 个 起 始 的 分 割 符 阵 
7 以 及 结束 程序 所 需 的 误差 临界 值 e 。 设 循环 的 次 数 :为 0。 


上 籽 
下 = 


吃 
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(CO) 用 娘 几 及 (10.4-12) 式 计算 模糊 集 类 中 心 {moii=12 ad 
G) 用 {mp 1i=12…M 及 (10.4-13) 式 计算 新 的 分 割 矩阵 Bee 。 
(4) 计算 4= 公 “一 攻 9|= mex 。 若 4>E,， 则 ft+1， 回 到 (2); 否则 结束 。 








ft 厅 1 1 
站 站 了 


10.5 利用 人 工 神经 网 络 做 图 像 模 式 识别 


1957 年 Rosenblatt 提出 感知 器 (berceptron) 模型 。 当 时 ， 以 感知 器 为 中 心 、 对 人 工 神经 网 
络 的 研究 曾 盛 极 一 时 。 然 而 ， 感 知 器 网 络 受 限 于 当时 的 人 工 神经 网 络 无 法 以 硬件 来 实现 ， 曾 
导致 人 工 神经 网 络 的 研究 停滞 不 前 另 一 个 受 抢 的 关键 是 Minsky 与 Paper 写 了 一 市 叫 感知 器 
的 蔬 ， 书 中 以 数学 证 明 ， 当 时 人 工 神经 网 络 的 学 习 能 力 极 差 .甚至 连 最 简单 的 “和 异 或 ” 
(exclusive of XOR) 的 问题 都 无 法 解决 。 

直到 1982 年 Hopfieid 提出 Hopfield 人 工 神经 网 络 模型 ，1986 年 Rumelhart 等 人 提出 反 
向 传播 (backpropagation, BP) 学 习 法 ， 及 计算 机 处 型 能 力 的 长 足 进步 ， 人 工 神经 网 络 的 研究 才 
再 次 受到 重视 。 本 节 将 介绍 人 工 神 经 网 络 的 基本 梳 念 及 其 模型 。 


10.$-1 人 工 神 经 细胞 模型 


大 工 神经 网 络 的 神经 细胞 模型 如 图 10.5-1 所 示 ， 可 视 为 具 多 输 人 及 单一 输出 的 信息 处 理 
单元 。 它 是 人 工 神经 网 络 构成 的 基本 单位 ， 称 为 神经 元 。 神经 元 会 随和 输 人 的 不 同 而 使 内 部 状 
态 变 化 ， 并 根据 内 部 状态 来 输出 。 由 狗 个 神经 元 所 结合 成 的 网 络 ， 即 为 人 工 神经 网 络 。 





图 10.5-1 ”人工 神 经 细胞 模型 


一 般 神经 元 闻 的 结合 可 配 以 加 权 值 ,而 随 加 权 值 的 变化 , 网 络 便 可 调整 到 所 希望 的 输出 。 
在 图 10.5-1 中 ， 某 个 神经 元 的 输 人 是 由 其 他 神经 元 的 输出 值 乘 上 加 权 值 w 的 总 和 和 值 
wx 。 而 神经 元 则 以 此 总 和 值 输入 一 转移 函数 几 ) 之 后 的 值 作为 输出 。 常 用 的 两 个 转移 男 


数 /0 如 下 ， 其 图 形 则 如 图 10.5-2 所 示 。 


广 六 站 


上 
1- {10.3-1) 


， 关切 上 
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0 (10.5-2) 


] 
四 1+exp( 一 2ya) 
其 中 6 为 常数 。 





{a) 临界 值 数 () 8 (Sigmoid 型 函数 
图 10.5-2 ”转移 洗 数 实例 


10.$-2 ”网 络 的 结构 及 学 习 方 法 


人 工 神 经 网 络 可 根据 网 络 结构 及 学 习 方法 加 以 区 分 ， 其 中 在 网 络 结构 上 ， 则 可 分 成 阶层 
型 及 相互 结合 型 ， 如 图 10.5-3 所 示 。 





(a) 阶层 型 网 络 


也 ) 相互 结合 型 网 络 
图 10.5-3 网 络 结构 
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@ 阶层 型 

此 型 的 挤 经 元 以 层 状 配置 ， 信 和 号 由 输入 层 传 达到 输出 层 ， 而 以 层 跟 层 来 结合 成 网 络 。 一 
般 以 由 某 层 的 某 神经 元 开始 ， 与 次 层 的 所 有 神经 元 结合 。 此 外 ， 上 层 与 下 层 之 间 的 结合 亦 有 
以 反馈 来 设 定 者 。 感 知 器 为 阶层 型 网 络 的 例子 之 一 。 


韶 相 下 结合 型 


相互 结合 型 并 设 有 尾 的 存在 ， 而 基 以 任意 神经 元 做 两 个 方向 的 结合 而 成 的 网 络 。 典 型 的 
例子 则 有 Hopfield 模型 等 。 

决定 网 络 结构 之 后 ， 下 一 步 是 以 人 工 神经 网 络 来 执行 信息 的 处 理 。 一 般 都 需要 先 做 网 络 
的 学 习 。 所 谓 网 络 的 学 习 是 指 将 加 权 值 调整 到 适应 训练 集 为 止 。 而 阶层 型 网 络 的 有 效 学 习 方 
式 之 一 是 先前 提 到 的 反 高 传播 学 悦 算 法 ， 我 们 将 在 10.5-3 节 介 绍 。 另 外 也 有 了 区 网 络 的 平衡 状 
态 作为 信息 处 理 结果 的 网 络 ， 如 10.54 节 的 Hopfield 模型 等 。 





S 大 二 层 及 层 
图 10.5-4 ”感知 器 的 构造 


10.5-3 ”感知 器 及 反 向 传播 学 习 算 法 


旬 上 知 器 


Rosenblatt 为 做 图 像 模式 分 类 所 提出 的 感知 器 原型 由 S (Sensory) 层 、A (Association] 层 及 
R (Response) 层 所 构成 , 其 中 辐 一 层 的 神经 元 不 相互 结合 ， 而 层 与 层 间 指 结 合 则 为 由 8 层 至 有 
层 的 单方 向 。 在 $ 层 与 A 层 间 的 连结 是 画 定 的 ,而 A 层 鞋 R 层 间 的 连结 则 为 可 变 的 。 除 输 
人 层 外 ,各 层 神 经 元 的 输 人 为 前 一 层 神 经 元 的 输出 乘 以 加 权 慎 而 来 ， 再 经 神经 元 的 转移 函数 
处 理 后 ， 输 出 到 下 一 层 。 

为 方便 说 明 起 见 ， 定 义 下 列 估 数 : 

上 六 第 下 -1 层 宰 经 元 的 编号 。 

第 上 层 神经 元 的 编号 。 

Pp: 第 丰 +1 层 神经 元 的 编号 。 

丸 : 表示 输出 层 号 码 。 


第 十 章 ”图 像 模式 识别 “231- 


6 :第 上 层 第 ;个 神经 元 的 临界 值 。 
六 :第 上 层 第 ;个 神经 元 的 输入 减 掉 临 界 值 的 净值 。 

0O# ;第 上 层 第 ;个 神经 元 的 输出 。 

wi ;由 第 下-1 层 之 第 7 个 神经 元 至 第 上 层 之 第 ;个 神经 元 的 加 权 值 。 
70) : 转移 函数 。 

上 述 参 数 的 关系 如 图 10.5-5 所 示 。 


TEL 个 5- } 


伸 y 了 中 上 





天 
图 10.5-5 网 络 参数 间 的 关系 
若 以 数学 式 表 之 则 有 
0 Of 一 8 (10.5-3) 


OF=7F) (10.5-4) 


@ 反 向 传播 学 习 算法 


反 向 传播 学 习 算 法 是 阶层 型 网 络 中 一 个 有 效 的 学 习 算 法 ， 广 被 采用 ， 也 是 目前 感知 器 的 
典型 学 习 算法 。 

反 疝 传播 学 习 是 利用 最 优化 理论 中 的 梯度 下 降 (gradient steepest descent) 法 的 观念 ， 将 所 
需要 的 输出 与 实际 输出 间 的 误差 逐步 最 小 化 的 一 个 方法 。 此 输出 误差 往 输 人 方向 “ 反 向 传播 " 
回去 ， 以 便 调 整 可 权 值 将 误差 闫 少 ， 这 是 称 为 反 向 传播 的 原因 。 以 下 将 推导 加 权 值 好, 所 需 
的 修正 量 Awr，。 

反 向 传播 学 习 是 监督 式 学 习 的 一 种 ， 亦 即 对 应 一 个 输入 有 预期 的 输出 、 观 察 实际 输出 与 
预期 输出 之 差 来 监控 网 络 的 学 习 。 此 种 网 络 学 习 模式 一 般 以 下 列 的 能 量 范 数 (或 称 为 误差 末 
数 ) 来 表示 学 习 的 品质 


至 -Zr 一 攻关 (10.5-5) 


其 中 为 输出 层 第 ;个 神经 元 的 预期 输出 ，O"” 则 为 输出 层 第 个 神经 元 的 实际 输出 。 上 式 中 
取 1/2 是 为 了 将 来 对 书 微 分 时 订 获 得 较 简 洁 的 结果 。 要 使 下 减少 所 需 的 加 权 信 修 正 量 应 与 五 
对 加 权 值 的 偏 微分 成 正比 ， 亦 部 
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Amw4i = ae (10.5-6) 
其 中 w 为 一 正 值 的 修正 比例 常数 。 上 式 又 可 写成 
Ai -2 0 一 -CEA0O (10.5-7) 
此 处 令 -di 。 
在 下 +1 关 严 时 ， 设 转移 函数 y 的 导数 为 六 ， 则 刀 ” 可 以 写成 
4 -5 3 许 这 2 5 5 Yo1d) 人 








在 上 +1= 六 时 ， 对 第 六 层 的 第 ;个 神经 元 ， 以 六 当 其 监督 信 导 ， 则 de 可 以 写成 


呈 =(20r -7 (10.5-9 
综合 上 述 绪 果 可 得 
An =-Qdi 0O， (10.5-10) 
其 中 
ad =(O" -多 ) 广 GT ) (10.5-11) 
4 ”= -| Wo | 本 )， 天 十 1< 而 (10.5-12) 


若 转 移 函数 为 (10.5.2) 式 中 的 8 型 函数 时 ， 则 下 式 成 立 
FUD=AUD- AoEOd-oo (10.5-13) 


反 向 传播 学 习 算 法 有 几 个 待 决定 的 重要 参数 ， 包 括 隐藏 ( 非 输 入 与 输出 层 ) 的 层 数 ， 每 个 
了 帆 藏 屋 的 神经 元 及 学 习 速 度 。 一 般 而 言 用 1 到 2 层 的 隐藏 层 可 得 不 错 的 结果 ， 这 是 因为 没有 
隐藏 屋 ， 不 能 反应 问题 输 和 人 各 种 神经 元 何 的 交互 作用 ， 误 差 较 大 ;， 过客 的 隐藏 层 又 造成 过 多 
的 局 部 最 小 值 ， 使 得 网 络 和 容易 掉 人 局 部 最 小 值 而 无 法 收 往 。 一 般 而 言 隐藏 层 的 神经 元 数 是 取 
输入 层 与 输出 层 的 神经 元 数 的 算术 平均 或 几何 平均 。 此 外 若 问 题 的 噪声 大 (方差 大 )， 则 隐藏 
层 神经 元 数 宜 减少 ; 问题 复杂 性 高 ， 隐 藏 层 神经 元 可 增加 。 学 习 速 度 快 代表 有 较 大 的 网 络 加 
权 值 修正 量 ， 有 可 能 较 快 收 伍 ， 当 然 也 有 可 能 反覆 振 葛 反而 更 难 收敛 。 因 此 学 习 速 度 必 须 愤 
选 之 ,一 般 取 95 或 01- 1.0 之 间 的 值 都 有 不 错 的 结果 。 


@ 以 反 向 传播 网 络 做 模糊 分 类 
以 传统 反问 传播 网 络 分 类 时 每 个 图 像 模式 一 定 都 有 一 个 惟一 的 归属 类 别 。 但 在 实际 的 问 
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是 中， 数据 的 归属 常 因 没 有 明确 的 边界 而 难以 确定 。 因 此 将 模糊 化 的 观念 如 入 反 向 传播 网 络 
的 讲 练 过 程 中 。 

考虑 一 个 好 类 的 辨认 问题 ， 因 而 网 络 输出 展 有 好 个 节点 。 设 王 维 的 向 量 到 与 ci 分 别 代 
表 第 ;类 中 中 训练 集 的 平均 值 与 标准 差 向 量 。 首 先 定义 第 ; 类 训练 模式 向 量 与 第 字 类 间 的 加 
权 紫 离 为 


了 
| 计 一 萌 
zy = 世 = 上 2 (10.5-14) 
乓 到 1 由 


其 中 xn 为 第 7 个 寞 式 向 量 的 第 直 个 分 量 ，mx 与 gx 分 别 为 mm 与 o, 的 第 天 个 分 量 。1/ cu 是 方 
差 归 一 化 的 因子 ， 使 得 高 方差 者 在 类 别 的 辨别 上 有 较 小 的 权重 (不 大 重要 )。 接 着 我 们 定义 第 
J 个 模式 在 第 ; 个 类 别 m 中 的 归属 程度 为 


1 
引 二 了 二 2 【10.5-15 
5 1+[E /ae ] 


其 中 必 与 万 为 控制 模糊 度 的 正 值 参数 。 申 上 式 可 看 出 ， 一 个 图 像 模式 与 一 个 类 别 的 距离 您 远 
则 其 归属 于 该 类 别 的 程度 人 意 低 。 若 所 有 5 均 不 为 零 ,i= 12…M ， 则 有 高 模糊 性 的 状况 , 若 
只 有 一 个 不 为 零 , 则 完全 没有 模糊 性 。 在 高 模糊 性 的 状况 ,我 们 采用 下 面 的 模糊 度 修 正 子 INT 
来 扩大 归属 度 的 差异 ， 以 降低 决策 时 的 混淆 。 


网 号 0 所 后， 筷 0.5 
oom 11-26-w 和 六 其 他 情况 


对 于 第 7 个 图 父 模 式 < ， 其 所 预期 的 输出 的 第 站 个 分 量 定义 为 


-| 高 模糊 性 时 
"van |， 其 他 情况 


其 中 0 三 思 ) 和 1， 对 所 有 产 有 这 些 输入 与 预期 输出 的 向 量 对 (*,, 兄 ) ， 就 可 以 用 传统 的 反 向 
传播 网 络 如 以 训练 了 。 


(10.5-16) 


(10.5-17) 


10.$-4 Hopfield 模型 


这 是 相互 结合 型 人 工 神 经 网 络 的 代表 之 一 ， 其 结构 如 图 10.5-6 所 示 。 由 网 络 结构 中 可 看 
出 ， 每 一 个 捉 经 元 都 良 别 的 神经 元 互 有 连接 ， 但 跟 自 己 不 相连 ， 因 此 


三 卯 站 【10.5-18) 


wy =0 (10.5-19) 
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图 10.5-6 Hopfield 玩 络 结构 


Hopfield 网 络 是 一 种 联想 式 学 习 网 络 模式 ， 它 由 问题 领域 中 取得 训练 集 (在 此 即 是 储存 在 
每 个 神经 元 的 状态 变量 值 )， 并 从 中 学 习 训 练 集 的 内 在 记忆 规则 ， 以 便 从 不 完整 { 不 标准 ) 的 状 
态 变量 值 中 推论 出 里 想起 ) 完整 的 或 标准 的 状态 变量 值 设 第 ;个 神经 元 储存 的 值 为 ww，uw = 
0 或 1， 则 所 有 神经 元 的 储存 值 就 形成 一 个 状态 向 量 (wz ww ) 。 图 10.5-7 (的 显示 一 个 具 
有 3 个 神经 元 的 Hopfield 网 络 结构 假设 每 次 只 能 改变 一 个 神经 元 的 储存 内 容 则 图 10.5-7 fb 
显示 所 有 可 能 的 状态 变化 。 


(0.0,1 (41 


000) 入 


《0:1.0) 





.00) (4.0) 
人 a) 结构 如) 状态 变化 


图 10.5-7 具有 3 个 神经 元 的 Hopfieid 网 络 的 结构 及 其 状态 变化 图 
Hopfield 网 络 解决 联想 式 学 习 的 概念 是 将 该 问题 转化 成 对 下 列 能 量 函 数 (或 称 Liapunov 
函数 ) 最 小 化 的 最 优化 问题 
BE- 记忆 wei (105-20) 


当 此 能 量 函数 达到 最 小 值 且 每 个 神经 元 的 内 容 都 不 再 改变 时 ， 表 示 网 络 已 达 收 熏 状 态 或 是 训 
练 完成。 
设 进入 第 / 个 神经 元 的 激发 值 为 3， 


Si = 2 (10.5-21) 
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其 对 应 的 输出 为 
(10.5-22] 


现在 证 明 依照 上 述 的 网 络 更 新 方法 ， 保 证 网 络 会 收 伍 。 首 先 下 单一 个 神经 元 ( 设 为 第 / 个 ) 所 
贡献 的 能 量 忆 为 


] 1 
瑟 ， 了 二 玫 / 二 了 吕 所 (0.2-23] 


4 


因此 当 第 7 个 神经 元 从 先前 的 值 z?” 改变 成 现在 的 值 zy” 时 ， 其 能 量 的 变化 ARE, 可 写成 





1 
一 也 之 
ix 


有 





AF = fm - 史 半 各- S (10.5-24) 


其 中 Aw 代表 & 的 变化 。 我 们 可 轻松 证 明 ( 留 做 习题 ) AE, <0 ， 因 而 得 证 。 
假设 现在 要 网 络 记 住 六 个 状态 向 量 区 = 人 own)， 工 县 六 丢 出。 一 个 网 络 加 权 值 
的 产生 方式 如 下 


wy(Cv， -DCv， -1 和 Q05.25) 


天 
Wi 二 0 Wi 一 Wi 


考虑 一 个 有 4 个 神经 元 的 Hopfield 网络 ， 则 由 (10.5-25) 式 以 及 网 = 全 010. 态 = 由 0,10) 可 
得 出 其 加 权 和 矩阵 琴 =fw ，} 


0 一 2 2 一 2 

一 人 0 一 人 2 
形 = 

2 一 了 0 一 2 

一 2 2 一 2 卫 


(10.5-26) 


假设 有 一 输 人 向 量 4340)( 相 当 于 初始 状态 )， 则 经 由 (10.5-21) 与 (10.$-22) 式 的 过 程 可 得 最 
后 网 络 的 状态 为 (0,10 。 由 此 看 出 一 个 不 完整 或 受 躁 声 影 响 的 图 像 模式 ， 经 Hopfield 网 络 
”的 联想 发 现 是 记忆 中 的 某 个 图 像 模式 ， 而 达到 辨认 的 目的 。 


习 题 


1 假设 有 四 与 加 两 个 类 别 。 血 的 训练 集 为 鸭 =( 人 0)，x, =(040; 各 的 训练 集 为 
xz; = (0 -2] ,xi = (20)。 以 (10.1-3) 式 找 出 决策 函数 D(a ， 依 此 决策 决定 x= (1.5-1.5) 的 
类 别 归属 。 

2. 证 明 (10.2-12) 式 的 决策 函数 形成 最 短 距 离 分 类 器 。 
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3. 对 一 个 128 x 128 大 小 的 图 像 ， 取 其 不 重 亚 的 4x4 子 图 像 为 到 类 的 输入 向 县 (16 维 的 向 
量 )， 共 有 守 少 个 向 量 ?” 写 程 序 执行 聚 类 法 ， 分 别 求 4、8 及 二 类 的 了 涌 类 结果 ， 包 括 每 个 类 
别 的 公 类 中 心 及 用 聚 类 中 心 取 代 真 实 图 像 疝 量 所 得 的 图 像 ， 最 后 计算 并 比较 这 些 新 图 像 的 
PSNR 值 。 

4. 以 分 成 两 类 的 FCM 对 下 图 所 示 的 数据 执行 分 类 : 





设 初始 分 割 矩阵 为 


oo 0.146 0.854 0.854 … 2 
0.146 0.854 0146 0146 … 0146|、，， 
设 误差 临界 值 E 为 001，r 则 选 为 1.25。 
S$. 证 明 (10.5-13) 式 。 
6. 仿 图 10.5-7， 画 出 4 个 神经 元 的 Hopfield 网 络 的 结构 及 其 状态 变化 图 。 
7. 证 明 (10.5-24)? 式 中 所 定义 的 ABE, 不 为 正 值 ， 即 AE, 近 0 。 
8. 验证 (10.5-26) 式 , 同时 将 输入 疝 量 为 人 140 时 获得 输出 状态 为 (0.4 乞 的 过 程 全 部 列 出 。 
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本 章 介绍 本 书 各 Matlab 实验 中 常用 的 指令 及 函数 。 若 要 得 到 详细 的 说 明 可 以 参考 其 他 
Matlab 的 书籍 或 是 进 人 Matiab 主 程序 中 键 人 help ooxx (eex 为 本 数 或 指令 名 称 )。 其 中 有 些 


函数 在 Matlab 的 Image 及 Wavelet toolbox 中 才 有 。 


取 实 数 的 绝对 值 或 复 变量 的 大 小 















| 到 实数 的 绝对 值 或 复 变量 的 K 小 | 

bm 
[ol | 求 下 小 于 荣 数 的 最 加 数 | 
[ER 
[全 三 
取 方 要 或 方 放 四 
加 | 二 族 人 政 灾 
| ao | 
ap 
[ae TAR 
人 TaW 
[ae | PE- | 
友 
名 al 将 项 朴 眠 阵 变 成 满 ffulD) 矩阵 
Ti 
|] AAA 
-让 
[as | RE | 
image | 对 加 你 mAm 声 | 
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显示 图 像 数据 
反 和 矩阵 
求 右 直接 乘积 
向 量 的 长 度 

线性 间隔 所 形成 的 庙 量 
读 .mat 文件 中 的 变量 


自然 对 数 函 数 


以 10 为 底 的 对 数 呈 孝 















































虹 阵 或 向 量 的 范 数 
元 素 均 为 1 的 矩阵 
圆 局 率 























震 匀 分 布 的 随机 数 
改变 给 阵 大 小 
Sin 
求 短 阵 的 大 小 
求 平方 根 
求 标 准 莽 
分 割 绘 图 窗口 


求 和 
进行 SVD 变换 















































teXt 

变换 成 unitg 的 格式 

重新 调整 数值 的 范围 

列 出 目前 使 用 中 的 变量 
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第 二 章 ” 实验 一 一 数学 基础 


L2.1 二 维 卷 积 


原 理 
对 于 一 个 LSI 系统， 输 人 译 列 xfm ma) 与 脉冲 响应 #m ms ) 的 卷 积 表示 成 


JI ma) 二 克 本 2) 下 ,ra ) 


一 > 了 bx 一 丰 ,ma 一 大 ] {L2.1-1) 


三 = 时 = 


这 是 一 个 很 重要 的 数字 信号 处 理 运算 。 以 数字 图 像 处 理 的 观点 来 看 . z 车 视 为 数字 图 像 ， 六 
为 处 理 方式 ， 则 ) 就 是 数字 图 像 处 理 的 结果 了 。 


程序 范例 
1. 目的 
给 一 输 人 信号 及 脉冲 几 应 ， 验 证 卷 积 的 结果 。 
2. 程序 及 说 明 
狼 程 序 L2_ lm: ”二 维 卷 积 冯 
x=[2 1;3 2]; %% 输 入 信和 号 
h=[-1 1:2 1]; 剖 脉 冲 响 应 
3 一 cony2(x ly; % 居 二 维 卷 积 
了 
3， 结果 展示 
-2 1 1 
y=|1 5 3 
日 7 了 
讨 论 


用 Matiab 作 卷 积 可 以 很 快 得 到 我 们 所 要 的 答案 , 这 正 是 Matlab 为 何 能 够 逐渐 取代 C 及 Fortran 
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等 程序 语言 的 原因 ， 除 了 conv2 这 个 函数 外 ，Matlab 还 有 其 他 许多 强大 且 和 多样 的 各 种 函数 可 


供 使 用 。 
动手 做 


1， 试 改变 输入 讯号 及 脉冲 函 数 ， 再 做 一 次 。 
2.x、 六 与 》 三 个 矩阵 的 大 小 之 向 有 何 关系 ? 


L2.2 第 阵 的 直接 乘积 


原 理 


一 个 好 x 丰 大 小 的 皇 阵 4 与 忆 x 吕 大 小 的 垂 阵 吾 所 形成 的 右 直 接 素 积 fdirect producb) 为 


一 大 小 为 PM xaw 且 定 义 如 下 的 矩阵 
aLD)B 
C=4@ 有 ={fatrmB 二 =- 2 
ahDB 


同 理 ， 左 直接 乘积 则 可 定义 成 C= 妇 @@4={5p,94。 
程序 范例 
1. 目的 


Gy A) 召 


a(2， NB aa21) 


ad ,NB 


给 二 个 简单 的 矩阵 4 与 如 验证 (4 罩 7 = 4 四 异 7 与 (4 轩 有 = 4 因 玫 -1 订 个 性 质 . 


2. 程序 及 说 明 


% 程 序 L2_2m: 失 阵 的 直 积 % 
A=[11-11]， 


B=[1 2;3 4]; 

Al=A; Bl=B'; 色 将 年 阵 转 置 
A2=inv(A); 。 B2=inv(B); % 求 反 和 上阵 
kronl1=kron(A,B); %% 求 右 直 接 乘积 


kron2=kron(A1L Bl1); 
kron3=kron(A2,B27 
kron_ jefA=kronl'; 
kron_right=kron2; 
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inyert_left-inv(kron1l); 
invett 六 ght 一 kron3; 





kron_1e 娘 
kron_mght 
invert_jle 茹 
invett_ fight 
3. 结果 展示 
1 3 -1 -3 1] 3 -1 -3 
2 4 -2 一 4 、 2 4 -2 一 4 
kron 1e 龙 = kon 1ight = 
1 3 1 3 1 3 1 3 
2 4 2 寻 2 4 2 呈 
一 1.0000 0.5000 LI.0000 ”一 0.3000 
， 0.7500 一 02500 一 0.7S00 0.2500 
inyvert te 人 稻 = 
一 一 1.0000 0.5000 一 1.0000 人 .5S000 
0.7300 一 02500 0.7S00 ”一 0.2500 
一 1.0000 0.5000 1.0000 -0.5000 
. ， 0.7S00 一 0.25S00 一 0.7500 0.2500 
也 vett fight 一 
一 1.0000 0.5000 ”一 1.0000 0.5000 
0.7500 ”一 0.2500 0.7500 ”一 0.2500 
讨 论 


验证 结果 完全 正确 。 若 矩 阵 很 大 ; 则 有 目 视 判断 验证 结果 较 困难, 此 时 应 将 左右 矩阵 相 减 ， 
再 以 简易 Matlab 指令 判读 结果 是 理 为 替 矩 阵 ， 车 是 则 验证 正确 ， 否 则 就 是 不 正确 . 


动手 做 


1、 试 验证 以 下 直接 乘积 的 性 质 : 
(4+BIBGC=4@C+BGC 

(2 (4@ 有 BC=4@(BBO 

(G) ad 和 天 =(odg) 色 且 = 4 有 (toB)， 其 中 必 为 纯 量 。 
(全 (4@ 下 (CO 有 =(dCJGBD) 

(9 tr(4 包 天 =trd)tr(B) 

(6) rank(4 人 有 区 =rankld)rank(B) 

(7) 若 旭 与 号 为 碌 正 ， 则 .4 名 吾 亦 是 。 
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2. 试 写 出 一 左 直 接 乘积 C= 号 @@4=1{6(p gd 的 程序 。 
3. 试 设计 一 个 程序 的 实验 ， 验 证 计算 (4C) @(BD) 确实 比 计算 (4 马 BC 因 四 来 得 快 。 


L2.3 马尔 可 夫 链 的 转移 概率 


原 理 
马尔 可 夫 链 的 上 阶 转 移 概率 定义 为 
Ph = 王 [DeD=31xn- 有 =3] 
代表 原来 在 状态 $ 的 情况 下 ， 经 过 让 次 状态 变迁 会 成 为 状态 8 的 概率 。 我 们 可 证 明天 阶 转 移 
概率 与 其 较 低 阶 的 转移 概率 间 有 如 下 的 关系 


(EL2.3-1) 


PY) = 立 必 全 "， 0<T< 天 (L2.3-2) 
汪 


其 中 吕 为 状态 总 数 。 


程 序 范例 


1 目的 
给 一 初始 状态 概率 ， 求 任意 正 整数 上 的 大 阶 转 移 概率 。 


2. 程序 及 说 明 
% 程 序 L2_3.m: 马尔 可 夫 链 的 转移 概率 % 


kk 一 8 一] 
P(1:2,1:2,DF=10.75 0.25:0.50 0.50]; % 设 定 概率 和 矩阵 〈 邯 初始 状态 概率 ) 


Q=-size(PNQQ(2 
ET kk=2: 
ff 广 1 
orj1 
POikkeF=0O; 
fr q=1 六 
PUiko-PUjikio+PdqbsP(qikdcD) 
end 
end 
end 
en 
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EECFEFe 
EEC 


讨论 


以 上 结果 与 课文 表 2.6-1 的 内 容 相 符 。 用 较 大 的 大 值 可 明显 发 现 其 高 阶 转 移 概率 的 确 都 
会 收 伍 至 一 个 定 值 


[0667 0333 
4 10.667 “0333 








动手 做 
1. 对 课文 内 容 第 二 章 习题 17 的 状况 ， 求 其 Ren 。 
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一 
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L3.1 纯 量 量化 器 的 设计 


原 理 


最 简单 的 结 量 量化 方法 就 是 把 整个 样本 值 的 取 值 范围 均匀 地 分 成 工 个 子 区 间 ， 此 万 均匀 
生化 的 观念 ， 若 子 区 间 大 小 不 一 ， 则 得 到 非 均匀 量化 器 。 前 者 通常 用 于 样本 值 大 致 均匀 落 在 
整个 取 值 范围 时 ， 后 者 则 对 样本 值 在 取 值 范围 出 现 机 会 不 均等 时 有 较 侍 表现， 而 所 谓 较 佳 表 
现 是 指 在 同等 位 数 下 ， 非 均匀 重 化 较 均匀 量化 实际 引入 的 噪声 小 。 本 实验 有 关 非 均匀 量化 器 
的 设计 是 根据 本 书 3.2-2 节 所 列 的 步 怠 来 设计 的 。 


程序 范例 


1. 目的 
设 图 像 灰 度 的 概率 密度 分 布 为 零 平 均 日 方 差 数 为 1 的 高 斯 分 布 


PP or| 吉 时 全 (3 


由 于 对 称 的 关系 ， 只 考 款 正 的 部 分 即 可 ， 因 此 谈 疏 =0， = ， 求 最 佳 量化 的 判决 层 
可 , 台 及 重 构 层 站 天 ,天 ， 其 中 工 为 偶数 。 


2. 程序 及 说 明 
% 程序 L3_l.m: 纯 量 量化 器 的 设计 %% 
[zsd]=quantizef2)， % quantize 尊 数 在 本 范 蚀 中 


[rLdl]=quantize(4); 


% 函数 quantizem: 高 斯 概率 密度 函数 的 非 均 匀 和 量化 % 


fnction [bdF=qnantize(IL) % 工 : 重 构 层 数 
Ilinspace(0,0. 工 7 d=tinspacef0.0,EH1); 
dfD=0; dCL+H-S00; 史 设 定 db=0，dL =500 (代表 无 穷 大 ) 


dinc=0.005;E inc=0.003; error_ bound1=0.002; errer_ bound2=0.003; 
IT_estimate=500;tolerance=[1e-4 1e-4]; 
r_init=-0.0]1; %xr(D 值 
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check 下 


while check= = 
(TFT_ 各 二 


for k=1:L-! 
dk+Hl)=ddo: %% 猜 测 的 dtk+bD 以 ddg 开始 运算 


响 比 对 所 得 的 zestimate 和 xz 之 差 ， 此 循环 在 ri 给 定 后 找 出 dfkrl) 的 
while absfT_estimate-ME)>error_ bound1l 
dktrD)=ddchl)+d inc; 弘 验算 不 符合 略为 增加 d ine 
Int_ N=quadCgauldtk)dk+lhtolerancey 
Int 了 D=quadCgauydtkjdtk+lytolerancey 
L_esttmate=Int_ NVInt 了 D; 
end 
rfkHH=2*dgkHl)r0o; % 有 从 dr 与 r 国 求 KkH 


endg 


吧 有 从 公式 算出 的 二 estimate 和 tktrl) 伊比 较 %% 
ItL_N=quad(Csaul dd(L+Ljtoletance); 
ItL_D=quadfgau ,dd(L+Ljtolerance); 

红 _estimate=IntL_ VIntL 卫 ， 

diff=rL estitmate-rIL); 
Telative_error=absfdi 人 YL estitmate; 


让 relafive_etror<error_ bound2 
Check=1; 
elise 
Check=0; 
T_init=r inittHr inc; % 不 符合 条 件 副 重新 选取 fl) 
end 
end 
%% 函数 Baum:ML 量化 器 设计 中 分 母 的 计算 式 % 
funetion y 一 gauf( 切 
了 178qrt(29Pi)eXPL-X,^272]; 


% 函数 gaul,mML 量化 器 设计 中 分 子 的 计算 式 %% 
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fnnction 和 天 Zaul(x) 
YX./Sqrt(29+pij.reXP(-X^272)i 


3. 结果 展示 


























讨论 


由 于 高 斯 分 布 的 值 在 零 附 近 较 大 ， 导 致 其 量化 的 值 在 零 附近 的 差距 较 小 ， 反 之 存 两 旁 所 
差 的 值 较 大 ， 也 证 明 非 均匀 量化 对 样本 值 在 取 值 范围 出 现 机 会 不 均等 时 有 较 佳 的 表示 。 本 实 
验 要 获得 较 精准 的 值 必须 选取 较 小 的 参数 ， 所 花费 的 设计 时 间 也 非常 可 观 。 


动手 做 


1. 试 求 不 同 的 重 构 层 数 的 结果 ， 例 如 工 =6。 
2. 改 用 不 同 的 概率 分 布 试 试看 ， 例 如 拉 普 拉 氏 分 布 。 


L3.2 ”量化 造成 的 假 轮廓 


原 理 


为 了 便于 计算 机 的 储存 ， 一 般 常 把 取 值 范围 分 成 2 个 区 间 ， 例 如 她 = 6.7,…,i2 .分 别 把 
像素 的 其 度 值 分 成 的 ,128…,4 096 个 区 间 。 当 区 间 不 够 时 ， 在 图 像 的 灰 度 值 上 变化 较 缓 慢 的 
地 方 会 出 现 候 轮廓， 这 是 由 于 量化 过 于 粗 炸 ， 使 量化 噪声 过 大 所 致 . 反之 ， 若 区 间 数 过 才 又 
会 使 计算 机 处 理 量 大 载 ， 所 以 应 适当 选取 刀 的 值 。 


程序 范例 


1. 目的 
给 一 张 256 个 灰 度 的 图 像 ， 将 它 取 较 少 的 位 数 ， 探 讨 其 图 像 在 视觉 上 所 产生 的 变化 。 
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2. 程序 及 说 明 


%% 程序 L3_2.m: 量化 造成 的 假 轮廓 % 
[Xmap]=bmpread(L3_2.bmp 广 
imshow(X/255,2^8) %B=8 
figure,imshow(X/255,2^6) 。 %B=6 
figure,imshow(X/255,2^4) 。。 %B=4 
figure,imshow(X/255,2^3) 。 %B=3 


3. 结果 展示 





(a) 原 图 像 ， 位 数 B= 8 





(加 瑟 =4 (d 互 =3 
图 L3.2-1 


讨论 
从 图 L3.2-1 可 以 看 出 当 表 示 图 像 的 位 数 愈 少时 ， 图 像 受 到 的 量化 噪声 较 大 ， 故 出 现 假 轮 


廊 的 机 会 也 您 大 。 在 本 例 中 位 数 为 4 时 ， 其 假 轮 廓 已 存在 。 一 般 而 言 ， 位 数 为 8 或 256 个 其 
度 时 ， 无 法 看 出 假 轮 廊 。 
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动手 做 
1. 才 用 几 张 图 像 ， 试 决定 平均 而 言 ， 当 了 为 何 值 时 ， 开 始 发 现 有 假 轮 廓 。 


L3.3 向 量 量化 器 码 本 的 产生 


原 于 


基本 上 向 量 量化 为 一 个 多 对 一 的 映射 过 程 ， 和 希望 可 以 利用 少数 几 个 向 量 来 代表 数字 图 像 
中 大 部 分 的 向 量 ， 我 们 将 这 些 少数 的 向 量 分 别 给 予 不 同 的 指标 ， 最 后 将 一 幅 数 字 图 像 中 所 有 
的 向 量 均 只 用 这 些 指标 来 表示 。 这 些 少 数 的 向 量 称 为 码 向 量 ， 而 其 集合 即 所 谓 的 码 本 ， 一 般 
而 言 码 向 量 是 经 由 许多 向 量 依 某 种 方法 反复 训练 而 得 。 

在 第 三 章 中 所 介绍 的 LBG 算法 即 是 用 来 产生 码 本 的 方法 。 它 是 利用 到 类 的 原理 ,依照 图 
像 中 向 量 之 间 的 欧 几 里 得 距离 的 大 小 将 其 分 类 ， 最 后 找 出 每 一 个 类 别 的 重心 ， 这 些 重心 就 是 
码 向 量 。 


程序 范例 


1. 目的 

将 一 幅 图 像 利用 LBG 法 分 别 训练 出 不 同 大 小 及 维度 的 码 本 : 此 64x4 、cb 64x16 及 
cb _128x4， 并 评估 其 效能 。 

2. 程序 及 说 明 


吼 程序 1L3 3.m: 向 重量 化 器 的 码 本 的 产 生 鸣 
鸣 简 用 LBG 法 产生 三 个 不 同 大 小 与 维度 的 码 本 % 


load ljena 听 读 人 一 幅 5$12xs5l12 的 图 像 矩阵 
也 =0.1， 鸣 设 定 LBG 程 序 停 止 训练 的 临界 值 
nc=64;nd=4;: 冯 设 定 码 本 大 小 为 友 ， 维 度 为 4 


[cb_64x4,distortion 64x4]=LBGCKncndthby， %%LBG 冰 数 在 本 程序 范例 内 
nc 一 64:nd=16， 

[ceb_ 64xl6,distortion_ 64x16jFLBG(CXKnc nd 由); 

lc 一 128;nd=16; 

[cb_128x16,distortion_128x16]=LBG(CXncndth7; 


响 男 数 LBGa:LBG 训练 法 多 
function [L_ codebookO distortonFLBGU imagenc'nd, 引 ) 
上 %%I_codebook: 最 后 所 得 的 码 本 咒 


屡 
| 
钼 
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唤 品 distortion: 向量 到 最 后 所 得 色 本 之 间 的 平均 误差 % 
%t image: 训 练 数 据 阁 


% Rearrangement of the training image 9 
[rowcolj=sizeft imageyhi 

nt=TOw*Colndi; 

R_image=f; 

sqrt_nd=sqrt(tnd); 
X_COUnt=fix(ceolsqrt nd); 
y_COuUnt=fix(rowysqrt_ nd); 


for 广 1:1:y_count 
fo j=1:1:X_ count 
T jimage=t imagetfi-l)*sqtt_ nd+l:issqtrt_ nd, 人 1)*sqrt_ nd+lj*sgrt ndy 
R_imapge=[R_imager_image(l2nd)]; 
end 
end 


% 及 ead training data and group the data into training vectorTs5h 
Tatio=fix(y_countyx_CountTnty; 
T_image= 日 ; 


名 r 冯 1:ratio:ratio*+ntt 
T_image=[T_imageR_imaged lnd)]; 

end 

吧 制 造 初始 码 本 %% 

ratio=fix(y_countsx_countncy; 

1_codebook=[]; 


for 诡 ]1:1aftio:tatiosme 
LI_codebook={L_codebook;R_imagel1:nd)]; 
End 


响 LBG Aigotithtmo4 

disp(CBeginELBG algorithrruand wait 3 
D 二 让 ; 

COnverge=1; 
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1_coun 二 1; 
PtLDFint 


whilefconyeleey 
%% 步 又 荆 : 将 码 本 内 容 当做 重心 ， 将 所 有 的 向 量 分 类 至 这 些 区 间 % 
T_dis=0; 


fear 1:1:nt 
P_dis=inf 
P_ index=0; 


%% 将 每 一 个 向 量 均 归 类 到 与 其 距离 最 短 的 重心 那 一 类 % 
frjF1:1ne 
dis=((T_imaget)-IL codebook0,)*fT image(i)-IL codebookg ,7 
让 dis<P dis 
P_dis=dis; 
P_index=j; % 归 类 
end 
end 


T_dis=T dis+P disAmnd; 
jd(D=P index; 
ebd 


卫 估 [DLLT_dismnt; 


% 步 又 2: 重新 计算 每 一 个 分 类 区 间 的 重心 并 取代 先前 的 码 本 内 容 史 
for i=l:t:nc 
count-0; 
U_codebook=zerosf1.nd); 
Ioz 产 丰 10t 
让 记 人 一 i 
U_codebook=U_codehbook+T imageg0 ,2 
count=eoount+1; 
end 
end 
让 count>0 
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LI_codeboolkti :nd=U_ codebookrcount 
en 
end 


% 步 又 3 :计算 并 判断 向 量 到 其 分 类 重心 之 冯 的 平均 误差 是 否 小 于 收敛 临界 值 岂 % 
dispCDistortion of curtent iteration = ); 
disp(T_dismtby; 
L_ceunt=L_count+]1; 
又 判断 前 一 次 和 这 一 次 的 平均 误差 的 修正 量 是 否 小 于 也 % 
这 abs((ODt(L count-1)-Dt(EL_ counbyDtL count-1))< 由 
COnVeTEeE 一 人 
end 
end 


O_distortion 一 T_dismnt: 唤 最 后 的 平均 误差 
dispfEnd ofthe LBG algorfnithm”; 


3. 结果 展示 








入 
| 一 


fb cb 全 x4 玛 本 的 内 容 te) 玛 本 中 所 存放 的 2x2 图 像 区 块 
图 L3.3-{ 对 原始 Lena 图 像 ， 利 用 LBG 算法 所 求 出 的 cb_64x4 码 本 的 部 分 内 容 


(gj 原始 Lena 图 像 


TD 


129 | 131 1 134 | 136 
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讨论 


由 LBG 算法 的 实验 中 发 现 , 码 本 大 小 越 大 , 代表 分 出 的 向 量 空间 较 多 ,因而 每 个 向 量 到 
其 所 属 分 类 重心 的 平均 距离 较 小 ， 使 得 此 向 量 量 化 器 在 失真 表现 上 有 较 佳 的 结果 但 所 必须 
付出 的 代价 则 是 较 长 的 训练 时 间 ， 亦 即 其 收敛 速 度 较 慢 。 基 本 上 ，LBG 算法 的 计算 复杂 度 与 
训练 向量 数 、 向 量 的 维度 、 码 本 的 大 小 、 训 练 循 环 次 数 的 乘积 成 正比 ， 而 其 中 训练 循环 次 数 
与 收 伍 临界 值 夺 有 密切 的 关系 ， 页 傅 小 列 训练 循环 次 数 愈 多 。 

在 收 敏 临界 值 均 为 0.1 的 状况 下 ， 对 cb 64x4、cb_64x16 及 ob 128x4， 每 一 个 向 量 到 其 
所 属 分 类 重心 ( 即 码 向 量 } 的 平均 距离 分 别 为 627、9.48 及 5.36， 显 示 码 本 变 小 与 维度 增 大 通 
常会 导致 较 大 的 平均 失真 。 


动手 做 


1. 试 着 将 训练 码 本 的 大 小 加 大 成 为 256， 或 是 将 维度 降低 为 [， 观 窗 其 平均 失真 ， 亦 即 
每 一 个 码 字 到 其 所 属 分 类 重心 的 平均 距离 。 
2 试 着 将 收 伍 临界 值 放大 ， 观 察 其 执行 程序 的 时 间 是 和 否 缩短 ， 及 平均 失真 是 否 变 大 。 


L3.4 向 量 量化 的 编 解码 


原 理 


在 向 量 量 化 编码 时 , 不 同 的 码 向 基 分 别 给 予 不 同 的 指标 , 借助 指标 而 非 向 量 本 身 的 传送 ， 
可 以 降低 表达 此 图 像 时 所 需 花费 的 位 数 ， 这 就 是 以 向 量 量化 做 医 像 压缩 减少 数据 量 的 原理 。 

图 L3.4-1 为 向 量 量 化 的 流程 图 ， 其 中 编码 端 及 解码 端的 码 本 均 相 同 。 每 输入 一 个 向 量 ， 
编码 端 会 到 码 本 中 去 寻找 和 此 向 量 有 最 短 上 离 的 码 向 量 ， 并 将 代表 此 一 码 向 量 的 指标 传送 至 
解码 端 。 解 码 端 主要 为 查 表 的 控 作 ， 将 此 一 指标 所 对 应 的 码 向 量 取出 当做 输出 向 量 . 完成 解 
码 的 操作 。 


输出 向 量 
7 





男 !L3.4-1 向 量 量化 的 流程 雷 
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又 图 像 压缩 的 好 坯 有 两 个 参数 可 作为 判定 的 准则 ， 其 一 为 峰值 信 蝇 比 


2355 


PSNR = 20xlog| 一 -一 -一 一 全 3.4-1) 
2 -让 
另 一 个 为 压缩 率 
CR 一 亿 3.4-2) 
程序 范例 
1. 目的 


利用 L3.3 节 的 LBG 程序 对 一 图 像 训练 三 个 大 小 及 维度 均 不 同 的 码 本 :ob_64x4 cb 64x16 
及 cb_ 128x16， 再 对 此 图 像 进行 向 重量 化， 并 比较 其 所 得 的 结果 。 
2. 程序 及 说 明 


% 程序 L3_4.m: 利用 LBG 训练 三 个 不 同 大 小 与 维度 的 码 本 并 分 别 进行 向 量 量 化 %% 
load lena 

tb- 有 .05; 

怠 训练 大 小 为 修 维 度 为 4 的 码 本 cb_64x4 唤 
Tc=64;nd=4; 

[cb 全 xd4]j=LBGOSncndth); 

交 训练 大 小 为 奢 维度 为 16 的 码 本 cb_64x16 吹 
nec=6d4d16; 

[ep_64x16]=LBG(X,ncndth); 

% 训 练 大 小 为 128 维度 为 4 的 码 本 cb_128x4 %% 
nc=]1282nd=4， 

[cb_ 128x4]=LBGCKncmndthh》; 


% 使 用 cb_64x4 的 码 本 进 答 向 量 量 化 % 

[MN]=size0Oo; 

[Y_ 的 x4.bit_ 64x4]=VQGCKcp_64xd4); 史 VQ 函数 在 本 程序 范例 中 
吃 讨 算 PSNR 和 CRo% 

MSE=-(sumfsum((X-Y 64x4).^2)7JCMYNT; 

PSNR_ 64x4=-20#log10(255/sqrt(MSPEy) 

CR_ 的 x4=MeNY8/bit 64x4 
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吃 使 用 ecb_64x16 的 码 本 进行 向 量 量 化 %% 
[64xl16.bit 64x16]=VQCXcb_ 64x16); 
MSE=(sumlsum(CK-Y_64x16)^2)7DKMYN); 
PSNR_64x16=20*1og10(235S/sqrt(MSET) 
CR_64x16=MYyMN*8bit 64x16 


% 使 用 cb_128x4 的 码 本 进行 向 量 量 化 鸣 
fY_1l28xl16.bit 128x4]=VQCXcb 128x4; 
MSE=(sumt(sumf(X-Y 128x4)^27MMYIN)， 
PSNR 128x4=20*log10(255/sqrt(MSEy 
CR 128x4=Me*Ny8mbit 128x4 


咱 函数 VQ.m: 向 基 基 化 % 

funetion [O_databitl=VQ(L dataI codebook) 
% OO_data: 经 向 量 量化 压缩 后 输出 数据 % 

吕 Idata: 输 人 数据 % 

吧 工 codebook: 向 量 量 化 码 本 吧 

%% bit: 向 量 量化 所 需 总 位 数 %% 


[roweceol]=size(L datah 
[ncndj=sizetI_codebook); 
bit_index=ceiflog2(tncy); 
hit=0; 

sqr_nd=sqtrtfnd); 
y_tatio=yowysqrt nd; 


X_tatio=Colsqg nd; 


鸣 将 每 一 个 向 其 均 拿 来 做 向 量 量化 % 
ior 1:y_tatio 


forj=T:x_ratio 
吕 取 一 个 图 像 区 块 当做 输 人 测试 向 量 % 
开 block=I data(G-li)#sqrt nd+l:issqrt_ nd， 


人 -Ti*sqrt_ nd+l:i*sqtt nd 


%% 寻 找 码 本 中 和 此 输 人 人 向量 最 接近 的 码 字 把 
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dstortion=sum 人 fff(ones(nc,J)*I block(:)D-IL_ codebook.^2777; 
min distortion=tminffind(distortion= =tminfdistortiot]]; 


%% 将 此 码 字 直 接 取代 输入 向 量 ,当做 输出 向 量 

有 block=reshape(L codebook(min distortion,:),sqrt_nd,sqrt_ nd) 

O_dataf(G-1)*sqrt_ nd+l:iysqrt_ndq, 
1-TD)*sqrt_nhd+l:j#sqrt_nd)=R_block: 












bit=bittbit index; 吧 累加 处 理 每 一 个 向 量 的 位 数 
end 
end 
3. 结果 展示 
(a) 原始 Lena 图 像 
{e) 码 本 =cb _64x16，PSNR=28.9，CR=21.33 (dj 码 本 =cb 128x4，PSNR=34.5，CR=4.57 
图 L3.4-2 用 三 个 码 本 伏 向 量 量化 压缩 后 的 图 僚 的 比较 
讨论 


其 图 3.4-2 的 结果 可 以 得 知 ， 在 LBG 训练 时 ， 当 码 本 越 大 ， 其 所 得 的 向 量 量 化 压缩 还 
原 的 图 像 失 真 越 小 ， 但 相对 的 其 正 缩 率 就 越 低 ， 这 是 由 于 代表 码 本 中 这 些 向 量 指标 的 位 数 较 
小 码 本 来 得 多 的 原因 。 


宇 
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另外 ， 当 码 本 中 每 一 个 向 量 的 维度 越 大 ， 即 每 一 个 指标 所 代表 的 像素 越 光 ， 则 纪录 一 幅 
图 像 所 必须 花费 的 指标 数目 也 就 越 少 ， 相 对 的 所 需 花 费 的 总 位 数 也 就 越 少 ， 这 就 是 为 什么 码 
本 维度 越 大 压缩 率 越 高 的 原因 ， 但 其 所 必须 付出 的 代价 则 是 较 高 的 图 像 失真 。 


动手 做 
1. 试 着 将 训练 码 本 的 大 小 加 大 成 为 256， 或 是 将 维度 降低 为 1， 并 针对 此 图 像 进行 向 量 
量化 ， 观 察 其 PSNR 及 CR。 


2 请 随意 取 一 幅 异 于 本 实验 所 采用 的 图 像 ， 并 利用 本 实验 所 得 的 码 本 进行 癌 量 量 化 ， 另 
外 重新 利用 此 四 图 像 训练 码 本 ， 也 进行 向 量 量化 ， 观 察 其 PSNR 及 CR 的 差异 。 


第 四 章 ”实验 一 一 变换 法 - 259 - 


第 四 章 “实验 一 一 变换 法 


L4.1 SVD 变换 
原 理 
4= 了 4 兢 《4 


其 中 珀 和 严 的 规范 正 交 向 量 分 别 是 44 与 44 的 特征 向 量 ，4 为 一 对 角 和 矩阵 ， 其 主 对 角 线 
上 的 原 素 是 44 的 特征 值 ， 并 可 推 得 


人 = FE4F (L4.1-2) 


此 变换 法 即 称 为 SYD 变换 法 。 
而 因 上 为 一 对 角 矩 阵 ， 且 主 对 角 线 上 的 元 素 是 4 的 特征 值 ， 这 些 特 征 值 中 ， 有 一 部 分 小 
到 可 以 忽略 ， 因 此 可 借助 忽略 较 小 的 特征 值得 到 全 的 近似 表示 。 


程序 范例 


1， 开 的 
(1) 验证 第 四 章 课文 内 容 中 有 关 SVD 变换 的 实例 - 
(人 2) 对 实际 图 像 进行 SVP 变换 。 


2. 程序 说 明 
%% 程 序 L4 1.m: SVD 变 杭 % 
A=[121;232;121]: % 宣告 一 个 惩 阵 A 
[ndvj=svdfAy; % 对 A 御 阵 进 行 SVD 变 换 
[nxnyF=size(A)， 吕 算 出 A 抢 阵 的 大 小 
I=eye(mconxy; %% 到 一 个 单位 矩阵 ， 其 大 小 为 nxxnx 
for i=nx:-1:2 
IGD=0; %% 将 对 应 到 的 主 对 角 元 素 设 为 0 
end 
了 B=uyT*dswwV; %% 乱 格 第 二 和 第 三 个 特征 值 所 还 原 的 失 阵 


B 怒 将 还 原 后 的 矩阵 显示 出 来 
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% 对 实际 图 像 进行 SVD 变换 %% 
[mapF=bmpreadCL4 1.bmp)，% 读 取 图 像 
A=XK120:220,120:220); % 将 图 像 的 一 部 分 取出 ， 并 命名 为 A 
[nxiny]=size(A); % 算 出 和 矩阵 的 大 小 
Iceye(nxunzo; 癌 取 一 个 和 A 同样 天 小 的 单位 矩阵 
for inx:-1:21 %% 将 单位 矩阵 工 的 部 分 主 对 角 线 元 素 设 为 0 

TO 5% 以 便 和 AAA 的 特征 值 矩 阵 相 乘 后 
end 色 消去 一 部 分 的 特征 值 
[udy]=svd(Ay; % 对 4 矩阵 进行 SVD 变换 
了 B=u#Ted*w'; % 将 A 矩阵 还 原 回 来 并 设 为 B 
subplot(211) 
imshow(A,map) %% 将 原始 的 图 像 显 示 出 来 
Subplot[212) 
inmshowfB,map) 双 将 近似 图 像 显 示 出 来 

3. 结果 麻 示 

百 = 


1.1093 1.8704 1.1093 
1.8704 3.1537 1.8704 
1.1093 18704 1.1093 








(a 厚 始 图 像 人 ) 近似 的 图 像 


图 “L4.1-1 
车 论 
由 实验 的 结果 显示 , 如 和 矩阵 和 4 矩阵 两 者 的 差距 其 实 很 小 ， 其 原因 乃 是 因 所 舍弃 的 特征 


秆 的 neomm 与 其 他 特征 值 相 比 起 来 非常 小 , 再 者 以 实际 的 图 像 做 范例 , 由 图 L4.1-1 中 可 看 出 
在 101 个 特征 值 中 只 保留 20 个 ， 所 还 原 的 图 像 仍 与 原始 图 像 所 差 无 几 ! 


动手 做 
1 念 程序 范例 ， 建 立 一 个 5 x 5 的 矩阵 ， 对 其 执行 SVD 变换 ， 每 次 舍弃 一 个 特征 值 再 将 
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其 还 原 ， 比 较 所 忽略 的 特征 值 对 重建 第 阵 的 重要 性 - 

2. 了 可 一 个 100x 100 的 图 像 ， 对 其 执行 SVD 变换 ， 含 弃 若 干 特 征 值 ( 设 其 为 零 1， 将 图 像 
还 原 重 建 ， 试 计算 图 像 每 个 像素 的 平均 误差 .最 后 画 志 纵 轴 为 平均 误差 横 轴 为 舍弃 特征 值 
个 数 的 曲线 图 形 - 


L4.2 图 像 变换 的 能 量 集中 能 力 


原理 


本 实验 评估 不 同 变换 对 图 像 能 量 重 新 分 配 并 集中 的 能 力 。 给 一 wx 交 的 图 像 ， 对 此 图 像 
执行 六 x 六 的 变换 后 . 保留 左上 钊 低频 部 分 nxa 的 系数 ， 其 余 系 数 设 定 为 零 ， 青 进行 放 x 太 
的 反 变换 。 重 建 图 像 与 原始 图 像 间 的 误差 失真 随 着 ”的 增加 而 减少 ， 当 呈 = 六 时 ， 误 差 降 为 
零 。 以 横 轴 为 ”， 纵 轴 为 误差 量 作 图 可 得 一 曲线 ， 曲 线 递减 至 零 愈 快速 ， 代 表 该 变换 的 能 量 
集中 性 (集中 在 少数 系数 上 的 性 能 ) 傅 好 。 





程序 范例 

1. 目的 

比较 DFT 与 第 一 类 DCT 变换 的 能 量 集中 的 能 力 。 

2. 程序 说 明 
吃 程 序 L4_2.m: 图 像 变 横 的 能 量 集 中 能 力 %% 
imagci=imreadf0L4 2.bmpy: 叹 读 取 原 图 像 
=88: 吕 处 理 图 像 天 小 
Image=imagel(1:N,L:N); 
errorl=energyfimage,1N); 史 ] 指 DCT 
error2=enereyfimage,2, %2 指 DFT 
plotfl:Nerrorl, .15error2) 5 虚线 是 DCT， 实 线 是 PFT 


xlabeln( 保 留 n 平方 的 变换 系数 ) 
text(40.80 DFT') 
ylabel( 于 方 误差 ) 
text(10.20.DCTJ) 


最 图 数 energym: 能 量 集中 闻 

fnction Tec_errot=energy(imagetypeN) 的 tpe :变换 方式 (DCT or DFT) 
5 typeE= 1 DCT，tfype=2: DFT 吼 

Iec_eITOI=zZelos( 上 ,NT 
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d image=doublefimagej255; 
让 type= 一 | 
coef al]=dct2fd_ imagehi 
else 
coef al= 生 2(d_Image); 
end 
for mn=1:N 
coef paf=2zeIos(NN)i 
Coef Dartf]:n,i:nj=coeft all(]1:n,13); 
全 type==| 
Tec_imapge= idct2fcoet Parth; 
else 
fec image 一 realGfft2fcoeft Patt 
end 
疙 求 误 差 量 % 
dit=d image-Iec_itmage; 
TeC_STOTnJSUTLSUmLdiI 2 
ed 





% 将 原 图 像 的 格式 变换 为 double 格式 
狼 做 DCT 变换 


吧 做 DFT 变换 


名 做 DCT 反 变换 


% 司 DFT 反 变 换 


% 存放 误差 量 的 数据 





3. 结果 展示 
平 ， 
广 
识 
40 条 20 40 5 可 10 有 细 
岂 保 留 半 平 方 的 变换 系数 ) 
图 L4.2-{1 DFT 与 DCT 的 能 量 集中 的 泰 现 
过 论 


从 图 L4.2-1 可 知 . 在 a<8 时 商 个 变换 的 表现 相差 不 多 ， 愈 到 后 面相 差 愈 多 ，DCT 的 曲 
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线 下 降 比 DFT 恢 ”出 进 得 知 ， 在 处 理 较 大 数据 时 、DCT 比 DFT 好 : 
动手 做 
1. 延续 上 例 的 做 法 ， 但 ax 关系 数 从 右 下 角 (高 频 处 ) 往 左上 角 (低频 处 ) 方向 取 ， 画 出 类 


似 狼 1L4.2-1 的 图 形 .， 并 讨论 这 两 个 曲线 图 形 时 差异 
2. 加入 白 选 的 第 个 上 摘 .将 对 点 的 第 三 条 上 曲线 加 人 图 L4.2-1 中 ， 并 讨论 新 的 结果 . 





L4.3 小 波 变换 
原 理 


小 波 变 换 可 将 信 生 的 和 不同 频率 成 分 分 解 出 来 “给 -图像 经 过 -- 层 的 小 波 变 换 可 得 到 如 
图 411- 100 所 不 的 分 解 站 果 . 其 中 让 (tr 胡 示 低频 成 分 ， 太 人 站 则 表示 地 高 频 成 分 . 
男 外 若 连 续 做 P 次 小 波 变 换 品 将 所 有 产 ( 人 ,站 看 成 小 波 疼 数 在 水 下 方向 的 影响 ， 产 (人 站 看 
成 在 垂直 方向 的 影响 ， 关 (ec 由 看 成 在 对 角 方 向 上 的 影 啊 


程序 范例 


1. 目的 

对 图 像 佑 小 波 变 换 ， 并 从 视觉 上 感 党 各 频带 系数 所 代表 的 意义 下面 做 了 两 个 实验 : (a) 
部 分 说 明 小 设 变 换 的 阶层 结 焰 ， 人 fp) 部 分 说 明 小 波 变 护 各 频带 系数 的 影 响 、 在 伯 ) 中 我 们 对 图 
像 做 四 层 的 小 波 变换 后 分 别 将 所 有 形 作 有 阅 、 大 人 、 产 全 刀 的 系数 舍弃 .其 结果 将 反应 
到 网 像 的 各 方向 上 

2. 程序 大 讽 明 


狼 程 序 L4 3am: 小 波 变 换 的 和 多重 解析 结构 鸣 

% dwrtper20: 为 Matlab 图 像 工具 稍 中 做 离散 小 波 变 换 的 抽 数 % 

0 其 中 dbl 示 使 用 滤波 器 长 度 为 1 的 和 aubeehiges 小 波 凸 数 咯 

% idwtper20: 重建 时 使 用 的 反 丢 换 图 数 的 

% wecodcmat0: 经 小 波 变换 后 必须 将 系数 重新 编码 使 其 落 在 0-255 之 问 ， 以 方 使 显示 
咯 以 上 均 为 waveiet 工具 稍 中 所 提供 的 困 数 号 






































clear: 
ioad woman 吕 载 人 图 像 
inmshow( 基 ,mapl, xlabelCta) 门 
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如 第 一 层 小 波 变 换 匆 

Thbcol=sizeftmap, 

ELLLHIJHLIHH1I]=dwtpet20XKodb19，， % 小 波 变 挠 产生 各 频带 系数 
coefl1=wcodetmat(LL1nbcop; 冶 调 整 频 带 系 数 天 小 
cocefl2=wcodemat(LH1nbcol; 

coefl3=wcodemat(HLt,nbcoh; 

Coef14 一 wecodemat(HH1:,nbco]); 


% 第 二 层 小 波 变换 %% 

[LL2.LH2.HL2.HH2j=dwtper2(LL1vdb15;， 上 % 对 低频 系数 再 敌 一 次 小 波 变换 
coefP21=wcodemat(LL2,nbcoly; %% 调整 频带 系数 大 小 
coef22=wcodemat(LH2,nbcol); 

coe 包 3 一 wcodemat(HL2nbcol)， 

coef24=wcodemat(HH2,nbcol); 

fgurei 

imshowft[ecoe 人 1.coe 包 2;coef23,coe 包 4]j,coefl2;coefl3coef14],map) 
xlabelegb 四 


% 重建 % 

ILLi=idwtper2(LL2LH2.HL2,HH2dbl)， 骂 反 小 该 变换 
IX=idwtper2trLL1LH1.HLI,HH1 dbly; 

figure; 

imshowfT:map)j, xlabet0fe 放 


ett=-SuUm{(SUrmfabs( 共 -IT 从) 


又 程序 L4 3b.m: 小 波 变换 系数 与 图 像 的 方向 性 %% 
clear， 

[X,map]=bmpreadCL4 3b.bmpy; % 载 人 图 像 
Subplot221) imshow( 和 XImap), Xlabelf (ga 


5%% 小 波 变换 % 

nbecol=slizefTtap,1 yi; 

fLLILLHIHLI,HH1I]=dwtper2(Kdb89;， 上 小 波 变 换 产 生 各 频带 系数 
[LL2,.LH2,HL2,HH2]=dwtpet2(LL1,db8); 的 滤波 器 长 度 为 8 
[LL3,LH3,HL3,HH3]=-dwtper2(LL2 db8g9; 
[LL4LH4,HL4HH4]=dwtper2(LL3,db8n: 
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嗓 重 建 ( 某 些 频带 系数 以 零 取 代 ) % 
altzero4=zerosfsjzefLEL4y); 
altzero3=>zefpsfsize(LL3)); 
altzero2=zeros(Size(LL2]hi 
altzcrol=zcrosfsizc(ELL1y); 


%% 芭 小 让 变 换 

TLL3=idwtper2f LL4,altzero4,HL4,HH4, db8 9; 

1LL2=idwtpet2ttLL3altzero3,HL3.HH3,db8' ); 

tLLIi=idwtpet2trLL2,altzeto2,.HL2.HH2.db87)， 

TX=idwtper2tTLL1ialtzerol,HLI,HH], db8' sizefXX)h 

difrtH=rX-X; % 计算 去 掉 各 层 第 二 频带 成 分 后 重建 的 图 
%% 与 原 琅 的 差异 

discardH=wcodemattdifrtHnbcolh; 冯 观察 去 掉 第 二 频带 成 分 后 的 影响 

subplot(222), imshowf(discardHmap)], xlabetf tb 方 


ILL3=idwtber2( LL4,LH4altzeto4,HH4,db87; 

IEL2=idwrtper2trLL3.LH3,altzero3,HH3 ,db8 7); 

1TLLI=idwtbper2(TLL2,LH2,altzero2,HH2, db 

TX = 这 wtpet2ttLLELH]altzerol,HH1 db8 sizefX)) 

由 ftV 一 [XX-X; 六 计算 去 掉 各 层 第 三 频带 成 分 后 重建 的 图 
% 与 原 图 的 莽 异 

discardV=weodemat(diftVabcoD; %% 观 察 去 掉 第 三 频带 成 分 后 的 影响 

subplot(223),， imshowfdiscardVonap), xiabelC(e 门 


ILL3=idwtper2tLEL4LH4,HL4,altzero4,dbpg8 
TLEL2=idwtper2tLL3,LH3,HL3,altzero3, db87); 
rLL1=idwtper2frLL2,LH2.HL2,altzero2 db8?; 
IX=idwtpesr2frLL1LHIHL1altzeroldb8 ,size(X; 
difrtX=rX-X; 名 计算 去 掉 各 层 第 四 频带 成 分 后 重建 的 
% 图 与 诛 图 的 差异 
discardX=wcodermmattdifrtxanbconh， 的 观察 去 掉 第 本 频带 成 分 后 的 影 啊 
Subpilot(224), imshowfdiscardX man, xlabelttd) 
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fb) 变换 后 系数 图 ley 重建 后 图 介 
图 [14.31 
原 痊 图像 与 重建 图 像 的 误差 
局 吕 棕 
43223Te -0D09 【小 到 几乎 可 以 粤 略 ) 





[al 原 图 居 


图 [1L4.3-21 符 域 ) 
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() 去 掉 访 从 (本 去 掉 ftx, 几 系 数 后 与 原 图 像 之 差 
图 1L4.3-2 ( 续 ) 


讨论 


由 1L4.3-1 可 看 出 小 波 变 换 多 解析 及 完全 重建 不 失真 的 特性 。 和 仔细 观察 图 L4.3-1(b)， 其 噪 
声 成 分 大 都 在 最 高 频带 广 (*, 妨 内 ， 越 往 左 上 则 图 像 轮廓 越 铺 楚 。 从 此 实验 可 知 ， 信 和 号 的 滤 
波 与 压缩 等 应用 均 可 经 小 波 变换 轻易 的 做 到 。 另 外 由 图 L4.3-2 的 由) 到 (中 表示 舍弃 各 频带 
系数 重建 后 与 原 图 像 的 差 值 ， 相 差 越 光 则 越 白 。 此 实验 显现 小 波 变换 后 各 频带 系数 分 别 对 水 
平 、 垂 直 及 对 角 三 个 方向 的 视觉 效应 。 


动手 做 


1. 重 做 侣 部 分 ， 但 将 最 高 频带 系数 舍弃 ， 计 算 其 重建 后 图 像 与 原 图 像 的 误差 ， 并 观察 
其 对 赢 图 像 所 造成 的 影响 。 
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L5.1 直方 图 均衡 化 法 


原 理 


其 度 图 像 的 直方 图 就 是 灰 度 的 一 种 统计 图 ， 从 此 统计 图 中 我 们 可 以 得 知 图 像 在 亮度 上 的 
特性 ， 包 括 其 动态 分 布 的 范围 。 当 一 张 图 像 的 灰 度 集中 在 某 一 段 区 域内 时 ， 图 像 的 对 比 度 会 
相当 差 。 为 改善 这 种 情形 ， 我 们 使 用 5.1-2 节 直 方 轿 均 衡 化 的 方法 来 处 理 图 像 . 

直方 图 雹 衡 化 的 意思 就 是 将 灰 度 绊 均 分 配给 图 像 中 的 所 有 像素 ， 使 灰 庶 的 直方 图 尽 可 能 
星 现 均匀 分 布 ， 如 此 可 提高 图 像 的 对 比 度 ， 图 像 看 起 来 会 比较 清晰 : 


程序 范例 


1 旨 的 

对 一 张 低 对 比 的 图 像 ， 以 直方 图 均 街 化 法 使 其 对 比 夭 增强， 同时 比较 处 理 前 及 后 的 图 像 
及 其 直方 图 。 

2. 程序 及 说 明 


%% 程序 LS_l.m: 直方 图 均衡 化 法 把 

% image_ 1 原 图 像 ; image_2 执行 直方 图 均衡 化 后 的 图 像 % 
image_1=imread(1L5 1.bmp93; 闻 读 取 图 像 
image_2=histeq(image 1); 冯 对 上 述 图 像 执行 直方 图 均衡 化 





imshowtimage 1 %% 最 示 原 图 像 
figure,imshow(image 2) 骂 显示 处 理 后 的 图 像 
figure,jmhist(image _]) %% 显示 原 图 像 的 直方 图 


fgure,imhist (image 妇 % 显示 处 理 后 图 像 的 直方 图 
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3. 绪 果 展示 









70001| 中 



















































































(a) 执行 直方 图 均衡 化 后 的 图 像 





讨论 


从 图 15.1-1 与 13.1-2 可 以 看 出 ， 原 图 像 的 灰 度 值 非常 集中 ， 导 有 致 其 对 比 度 效 果 差 ， 而 经 
过 直方 图 均衡 化 处 理 后 ， 图 像 灰 度 值 重新 分 配 ， 计 整 幅 图 像 对 比 度 提 高 许多 。 


动手 做 


1 利用 Mattab 中 Image Toolbox 的 imhist, 将 原 图 像 的 灰 度 值 范围 重新 定义 在 S0 到 100, 
150 及 200， 并 比较 其 结果 。 

2. 利用 Matiab 中 Image Toolbox 的 imhist, 将 原 区 像 的 灰 度 值 范围 分 为 9 ~- 100 及 150- 
200 两 个 范围 ， 并 比较 其 结果 。 
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LS.2 平滑 滤波 器 
原 理 


@ 低 通 空间 滤波 器 
低 通 滤波 器 中 常见 的 均 化 模板 是 将 模板 中 所 有 灰 度 值 加 总 后 求 其 平均 ， 然 后 将 平均 值 写 
人 模板 中 间 所 对 应 点 的 像素 。 又 因为 一 次 只 处 理 一 个 像素 的 值 ， 旁 边 的 像素 在 下 一 次 的 模板 
移动 后 再 作 处 理 ， 本 此 又 称 为 移动 平均 滤波 器 。 此 滤波 器 可 去 除 噪声 ， 但 也 会 产生 图 像 模糊 
的 反 效果 
常用 的 空间 模板 是 由 3x3 共 9 个 19 的 系数 所 组 成 
19 19 19 
1]9 lo9 区 (L5.2-]) 
1l19 lo 9 
也 可 提高 模板 中 亲 的 如 权 值 变 成 
10 00 1 
in0 2110 TY (L5.2-2) 
110 400 16 
或 是 提高 模板 中 间 与 四 邻接 点 的 加 权 值 
l16 8 06 
I8 4 ] 蕊 (L5.2-3) 
MI6 18 16 
注意 到 以 上 模 松 的 加 权 值 总 和 为 1， 如 此 才 不 至 于 造成 空间 卷 积 运算 后 图 像 过 亮 或 过 上 的 结果 ， 
多 中 值 滤波 
模板 的 排序 运算 是 一 种 非 线性 的 泪 波 方式 ， 首 先 对 在 模板 里 所 有 像素 的 灰 度 大 小 做 排 
序 ， 接 着 选取 排序 在 中 间 的 藉 度 值 ， 再 将 此 值 代 人 所 对 应 的 休 素 中 ， 如 此 便 完 成 一 个 父 素 的 
滤波 操作 ， 此 法 不 但 可 以 滤 掉 图 像 中 突起 的 高 频 嗓 声 部 分 ， 对 于 图 像 的 边缘 ， 常 也 能 够 给 


程序 范 全 


1. 目的 
给 一 张 受 污染 的 图 像 ， 分 别 以 低 通 汪 波 器 及 中 值 滤波 的 方法 去 处 理 ， 比 较 其 处 理 结 果 ， 
2. 程序 及 说 明 


%% 程序 L5 2m:; 平滑 滤波 器 听 
% Image: 原 图 像 % 
% Image_noisy: 受 污 染 的 图 像 % 
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% Image_iow: 执行 低 通 泪 波 器 后 的 图 像 %% 

% Image_med: 执行 中 值 下 波峰 后 的 图 像 % 

Image=imreadfL5S 2.bmp' %% 读 取 图 像 

% 将 胡椒 盐 式 的 噪声 加 入 原 图 像 中 ， 其 中 0.02 是 噪声 密度 % 
Image noisy 一 imnoise {Image ,Salt 皮 Pepper,0.00); 


Image2_ hoisy=double(mage noisy)/255; 站 变 为 double 格式 
h=[19 1/19 19;L9 1/9 119 ; 19 19 19]; %% 滤 波 器 的 子 模板 

Image low=filtet2(h, Image2 noisy) %% 执行 低 通 滤波 

Image med=imedfitt2(Image hoisy,[3 3]》 嗓 中 值 滤波 采用 3x3 矩阵 
%% 显 示 图 像 咯 

jmshow{Image) 


fiegnre,imshow(Image_noisy) 
fgure,imshowfImage_low) 
figure,imshow(Image Imed) 


3. 结果 展示 









(a) 原 图 像 





(a) 低 通 济 波 他 ) 中 值 湾 波 
图 15.2-2 ”将 受 污染 的 图 像 滤 波 处 理 后 的 结果 ， 
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讨 论 


根据 图 L5.2-2 中 两 张 用 不 同方 法 处 理 受 污染 图 像 的 结果 可 以 发 现 ， 在 周 像 的 清晰 度 上 ， 
用 中 值 滤波 处 理 比 用 低 通 滤波 处 理 效果 还 要 好 .如 在 蛛 理 中 所 述 ， 因 为 低 通 滤波 是 一 种 平均 
的 方法 ， 其 边缘 效果 被 破坏 ， 使 图 像 变 模糊 ， 反 之 中 值 滤波 是 一 种 排序 方法 ， 其 图 像 及 边缘 
的 保持 效果 较 好 。 而 在 噪声 处 理 上 ， 中 值 滤 波 处 理 后 的 图 像 内 ， 了 噪声 几 乎 看 不 到 ; 而 在 低 遂 
汗 波 处 理 后 的 图 像 中 ， 其 吕 声 还 是 存在 ， 只 是 较 模 糊 不 明显 而 已 . 总 之 ,在 噪声 的 处 理 上 ， 
中 值 滤 波 比 低 通 滤波 效果 更 佳 : 


动手 做 

1， 问 上 例 ， 将 模板 大 小 改 为 SX5， 与 上 例 比较 其 差异 . 

2. 将 上 例 中 所 加 的 噪声 变 为 高 斯 噪声 ， 重 做 本 实验 ， 并 讨论 其 结果 。 
L5.3 辣 态 滤波 上 骨 


原 理 
假设 一 个 图 像 了 可 由 光 强 度 ; 与 物体 反射 光 强 度 * 的 丧 积 来 决定 ， 即 
六 = (LS5.3-1) 


经 过 同 态 滤波 后 其 结果 会 改变 图 像 光 强度 与 反射 光 强 度 的 特性 ， 因 此 我 们 可 以 做 到 同时 降低 
图 像 动态 范围 ， 又 增 加 对 比 床 的 结果 ， 所 用 的 方法 及 过 程 如 图 工 5.3-1 所 示 。 


EHIEEHOSHOSHESH， 


图 15.3-1 同 态 瑟 波 的 程序 
在 图 1.5.3-] 中 ， 互 做 站 为 一 二 阶 的 Butterworth 高 通 斌 波 器 ， 其 转移 函数 定义 如 下 


yz 
吾 { 估 .站 = 一 一 一 一 一 -一 工 3.3- 了 3 
{ ? ] 信 十 1+ED7D(ED] { 】 


上 式 中 忆 , 为 截止 频率 ，PD( 六 = (说 + 天 天， 与 7 为 可 调整 的 参数 。 可 针对 不 同 的 图 像 采 
用 不 同 的 参数 值 ， 通常 选择 广 <1 ，(y +y)>1， 会 获得 所 要 的 结果 。 


程序 范例 


1， 目 的 
采用 同 态 滤波 增强 图 像 的 对 比 度 ， 并 使 图 像 较 暗 的 地 方 变 得 吏 清 楚 。 


2. 程序 及 说 明 
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% 程序 15 3m: 辐 态 滤波 种 %% 


clear 

Fimage_0tmap]=bmpread0Ls 3.bmp"); 
image_1=Joglimage 0+1); 
image_2= 全 2fimage_ 17) 


又 产生 高 通 Buttenworth 滤波 器 听 
TD 一 3; 
D0=0.05*pji 
个 一 个; 
刀 = 人 .5; 
[rowcol]j=sizefimage 2) 
for kt=1:1:70wW 
forl=1:1:col 


DIDFsqtt(Gk 2 2) 


嗓 读 取 图 像 
% 取 自然 对 数 
%% 做 二 维 傅立叶 变换 


HDLHEODODIGD 2 


end 
end 


image_3=(image 2.*HD); 
image 4-ifft2(image_ 3》 
image 5=(exp(image 4)-1; 


figuret]) 
inmshowfimage_0map) 
figuret2) 
imshowfrealfimage Slimnap) 


3, 结果 展示 





(a) 原 图 像 


% 输 和 图像 通过 滤波 器 
%% 做 二 维 反 傅立叶 变换 
% 取 指数 函数 


吃 显示 原 图 像 


5 显 示 处 理 后 的 图 像 


15.3- 





(b) 执行 同 态 滤波 后 的 图 像 
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一 -一 一” 


讨论 


从 图 L5.3-2 可 以 得 知 ， 经 过 同 态 滤波 后 ， 整 张 图 像 较 之 前 的 图 像 更 清楚 是 较 障 的 地 方 也 
变 的 更 明亮 清晰 。 若 将 原 图 像 以 直方 图 均衡 化 法 处 理 后 (如 图 L5.3-3)， 再 相 比 较 可 发 现 ， 虽 
然 都 是 将 图 像 变 得 更 清楚 ， 但 是 在 仔细 观察 后 仍 可 发 现 图 像 经 过 同 态 滤波 后 ， 对 比 度 比 直方 
图 均衡 化 法 的 结果 更 明显 。 





图 15.3-3 ”执行 直方 图 均衡 化 后 的 图 像 
动手 做 


1. 试 着 选取 不 同 的 阶 数 = 、 截 填 频 率 疡 及 参数 y 与 y， ， 看 会 得 到 何 种 结果 ? 
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L6.1 最 小 平方 滤波 髓 


原 理 


图 像 恢 复 的 主要 目的 是 去 改善 一 幅 品 质 遭 受 恶化 的 图 像 . 恢复 是 一 种 过 程 ， 此 种 过 程 试 
图 利用 对 亚 化 现象 发 生 之 前 的 了 解 , 建立 亚 化 的 模型 ， 再 运用 相反 的 过 程 来 重建 或 恢复 图 像 。 
最 小 平方 wiener 淡 波 器 图 像 恢 复 法 的 公式 如 (6.4-110 式 


Po 号 化 四 je (L6.1-1) 
于 二 LS (D1S7 CE 





式 息 下 [=012 AN-1，7y=le- 
如 果 不 知道 曲 声 的 统 诗 性质 ， 即 3 优 六 舟 S， 大 站 未 知 时 则 (EL6.1- 昌 式 可 表示 为 


到 (人 ,站 = ] 中 全 (开门 人 6.1-2? 
芝 巡 电 | 吾 (个 + 天 








式 中 迫近 似 为 一 常数 :此 式 可 以 使 恶化 图 像 得 到 某 种 程度 的 恢复 ， 但 未 必 是 最 佳 恢 复 。 
在 实际 的 应 用 中 ， 吾 ( 站 可 以 用 解析 的 方法 得 到 。 本 实验 考虑 一 个 因 茹 相 机 水 平 晃动 而 
被 模糊 的 图 像 ， 并 用 Wiener 沽 诈 恬 来 恢复 。 而 长 度 24 的 照相 机 水 平移 动 模糊 如 (6.6-7) 式 


忆 ， 严 关 申 一 ae 袜 所 挟 避 
Am=11 0 sn (L6.1-3) 
2 好 





由 (L6.1-3) 式 再 经 离散 傅立叶 变换 、 可 得 图 像 因 照 相机 水 平 吨 动 而 被 模糊 的 转移 函数 
吾 尼 站 ， 再 用 最 小 平方 (Wienen 谈 波 规 恢 复 法 公式 (L6.1-2) 式 ， 调整 适当 的 天 值 将 模糊 的 图 
像 恢复 : 


程序 范例 
1， 上 前 的 


对 -- 张 因 照 相机 水 平 昆 动 而 被 模糊 旦 加 有 了 噪 声 的 图 像 ， 使 用 最 小 平方 (Wienen 滤波 器 恢 
复 、 同 时 比较 和 =0 及 10.000 1 两 种 不 辐 参数 值 时 图 像 恢复 的 结果 。 
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2. 程序 结果 及 说 明 


锰 程 序 1L6_1m: 最 小 平方 汪 波 器 匆 
%% 设 定 长 度 2d 的 照相 机 水 平移 动 模 糊 的 函数 %% 


clear % 清除 变量 
d50; 六 该 定 长 庶 
h=zeros(2*d+1,2*d+l); 

htdr1,1:2*d+T)=172*d)， 吧 函数 

名 将 图 像 模糊 旦 加 入 噪声 % 

作 imread(L6 1pmp'y; %% 读 取 锅 像 
[mnj=size( 介 ; % 枉 像 大 小 
扎 =zefrosfm 十 2 本 dd,+2*#d); 

巧 (1:m,1:2n)= 寺 % 拉 增 蒜 
he=zetosftmn 十 2 站 n+2*y 昌 1 

he(1:2+d+1,1:2*d+1=h， 站 扩 增 hh 

下 = 位 2( 候 ); 

HH= 人 20he): 

ns=S$+Tandfm 上 2kdn 二 29yd)， 蚂 产 生 品 声 
ii 人 +*H)+nsi % 被 模糊 化 县 如 有 史 声 的 图 休 
G= 全 28) 


吕 利 用 最 小 平方 (Winen 滤 器 恢复 图 像 %% 


K=0; %% 设 定 双 值 
F_estimate=f(HL^A2)AHA2HKD.*GVH， %% 基 小 平方 (Wiener) 滤波 器 恢复 公式 
f estimate=realfifft2EF estimatey; %% 恢 复 后 的 图 像 


叹 结 果 展 示 叹 

imshow 人 %% 显示 模 祖 化 前 的 网 像 
%% 显示 模糊 再 加 噪声 后 的 图 像 % 

figure 

intshowfg(d+l1:m+dd+in+di[mintgty maxfgC]) 

吧 显 示 恢 复 后 狠 像 % 

fguTe 


ipnashow(ft estimateflmy1:2n[mnintf estimate(J) Iaaxff estimatef 7 ) 
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忆 
己 15S 


(a) 原 图 像 (b) 照相 机 水 平 晃动 而 被 模糊 化 
再 加 噪声 后 的 图 像 


L6.1-1 





四 取 扩 =0 时 0 取 拓 =00001 时 
图 6,.1-2 恢复 的 结果 


讨论 


从 上 天 张 图 像 及 实验 的 经 验 发 现 ， 对 照相 机 水 平 晃动 而 被 模糊 化 的 图 像 加 上 噪声 时 ， 必 
须 调 整 适当 的 丘 值 才能 利用 最 小 平方 (Wienen 滤波 器 清楚 恢复 图 像 。 


动手 做 


1. 尝试 其 他 图 像 ， 重 新 执行 程序 ， 观 察 恢复 结果 。 
2. 采用 不 同 的 噪声 大 小 ， 调 整 适当 的 关 值 恢复 图 像 。 


L6.2 ”友人 代 育 目 去 卷 积 法 


原 理 


假设 我 们 得 到 一 个 受 污 染 的 图 像 g(m,m 是 由 原始 图 像 Fr 站 与 点 扩散 函数 (PSF) 
PCm, 及 的 着 积 所 构成 ， 则 我 们 可 以 采用 选 代 盲 目 去 着 积 法 来 恢复 原始 图 像 ， 其 方块 图 如 图 
6.6-3 所 示 。 


一 开始 我 们 假设 一 初始 佑 测 图 像 态 (m, 四 ， 接 着 就 在 图 像 与 频率 域 间 交 蔡 变 换 运 算 ， 
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再 加 人 一 些 有 关 图 像 及 PSF 信息 的 条 件 限 制 。 在 第 > 次 选 代 时 ， 傅 立 叶 赴 的 条 件 限 制 为 








CG 人 (做 DR 人， 站 
: (L6.2-1) 
竹本 0 +ol 订 ,人 
世 伙 7 -GUOnckD (L6.2-2) 
六 GD +olEGI 








其 中 必 是 相 加 性 噪声 的 能 量 。 
在 本 实验 中 ， 我 们 不 考虑 噪声 所 造成 的 影响 , 亦 即 w=0。 则 (6.6-0 及 16.6- 力 式 可 分 
别 化 简 为 


GD _ 
末 ( 门 = 二 (L6.2-3) 
G 优 , 门 
疡 人才， 1 万 末 C (L6.2-4) 
此 处 有 两 个 主要 的 问题 存在 ; 


1. 因为 反 冰 歼 的 运算 ， 使 得 具有 低 数 值 区 域 的 函数 在 定义 上 会 有 困难 。 

2. 在 天 (6 或 太 ,全 丰 的 零点 所 在 的 特别 区 域 的 频率 上 无 法 获得 任何 信息 。 
为 了 解决 这 两 个 问题 ， 此 处 加 人 了 傅立叶 域 的 条 件 限 制 (Ayers and Dainty [1988]): 
若 |G(E 人 <noise level 


所 ( 丰 六 = 到 估 站 (L6.2.5a) 


车 过 (中 >|G(t 个， 








尼 (全 站 =( 一 四 甩 估 站 + 一 CU (L6.2-5b) 
声 ( 修 站 
车 人 ,全 中 <|G(ED， 
1 -4 ， 玄 kD a62 .59 


天 (GOD 疡 大 站 “GD 


其 中 0sws1 。 
在 模糊 的 条 件 限 制 中 , 我 们 将 反 情 立 叶 后 的 图 像 所 (nm 站 中 像素 值 为 负 值 者 设 为 0。 而 在 
图 像 域 的 条 件 限制 中 ， 将 所 猜测 的 物体 图 像 的 区 域 范围 外 的 像素 值 设 为 0。 


程序 范例 


1. 目的 
将 一 幅 被 模 精 的 轿 像 ， 利 用 选 代 育 月 去 卷 积 法 来 恢复 其 原始 的 图 像 。 
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2. 程序 及 说 明 
%% 程序 L6_2.m: 送 代 育 目 去 卷 积 法 % 
elear 
%% 制作 模糊 的 图 像 %% 
[ho,map]=bmpreadfL6_2abmpy; %% 读 取 图 像 hg 
[ 芭 ,map]=bmpread(L6_2b.bmp); % 读 取 图 像 印 
[7]1,y2]=size(80); 嗓 量 测 hn0 天 小 为 yY1xy2 
中 lu2]F-sizef); 嗓 量 测 各 大 小 为 utixu2 
yY 一 yl11Y2; 
U=uUET+U2; 
he=zeros(y. yy % 将 (91+y2)xfyl1+y2) 的 零 官 阵 令 为 he 
让 =zerosfu,u); 多 将 和 ut+Tu2yxfultua2) 的 零 算 阵 令 为 亿 


中 将 ho 扩张 为 (y1+y2jx(y1+y2) 的 定 阵 吧 
hel[Y4:(4)Hy1-1 [4: (4)+HY2-1])=ho; 

% 将 功 扩 张 为 (nl+u2)xful+u2) 的 上 矩阵 狼 

和合 ([u4:0a4)Hal-il[u4:074iHu2-1 关 人 抱 ; 

hl1=he; 

位 = 人 ， 

E 一 站 2 

于 = 声 20hly); 

G=RF*Hi 色 将 了 与 h 做 着 积 得 到 模 灶 图 像 g 
gl1=iftt2(G); 

叹 显 示 PSF 的 图 像 % 

fgurelimshowtrealthly [Paintrealthit maxfTrealthtity Ti; 
六 显示 原始 图 从 % 

在 gure,imshowtreatfl), [mintrealfl 人 7 maxfreakTlC7D] 
% 显示 模糊 的 图 像 % 
Eurejimshowftealgl)[mintrealfgl1(D) maxfreal(EH 广 TD 


嗓 开始 执行 迭代 言 目 去 卷 积 法 %% 


名 =rand(64,64); %% 猜 测 的 初始 图 像 
% figuteimshowfreatt 切 ) [minfreal( 吉 《人 访 maxfreali 色 人) 力 ] 
FU = 旗 2( 如 


% 加 上 傅立叶 域 的 条 件 限制 % 
HO=G+(E0_AC1)) 
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ho0=iftt2(HO); 

六 加 上 模 灶 的 条 件 限 制 ， 将 猜测 图 像 的 区 域 范围 的 外 设 为 零 % 
hoOtL1:y4] :OnofIC4)Ty71-17] 0; 

hot,[l:y4D=0:bhotl [fw4)+y1-1:7]J)=0; 

ho0_=h0; 

HU_ = 他 2fh0 ) 

u=-0.9; 吕 设 定 参数 


痢 进 行 循环 迁 代 的 步骤 %% 
for i=1:1500 怠 说 定 迁 代 的 次 数 
1 
ork=1: 人 6 
faf [=1:64 
又 加 上 和 傅立叶 域 的 条 件 限 制 % 
这 absfG(k)<=0.05， 最 设 定 noise level 为 0.05 
Fit 人 k, 四 =F0_ 人 kb; 
else 让 abs(HO_(k,I>=abs(GUCD); 
FltcD=(1- mw*FO_ GD+. 
urWGUdoD.*(HO_(cD CD 
861Se 
Fi(kJD= LE (ACID 人) 
UHO (DGdoD CD CD 
end 
end 
end 
电 = 进 这 人 下] 


5% 加 和 人 图像 域 的 条 件 限 制 ， 将 负 值 的 像素 值 设 为 零 % 
Xl=ieal(fl);xX2=imag( 红 )， 

XX 一 find(xt<0); 

XXX 大 0; 

名 ”=X]1; 

各 (人 [1:74],:)-0 铝 《[(d4)Hy1-1y]:0; 

角 ([14PF0 名 (YYyIEY])=0; 

名 = 和 ; 

FO = 全 2( 扣 ))， 
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狼人 博 立 叶 域 的 条 件 限 制 吧 
HO=-G.AF0 .AL 
h0=ifft2(H0)， 


冯 模糊 的 条 件 限 制 %% 
hodl7/4],:F0bhod(w4)+y1-17].0; 
bot [lyYd4]) 记 obhot [Gd4Hyl-1yTD=0; 
Wl=real(h0j:w2=imagh0): 
WwW 一 findlw1<0); 
WlCww(DD-0; 
ho =w]; 
HO = 秀 2(h0 ); 

End 


% 显示 恢复 后 的 图 像 % 
figurejimshowfrealtfn_)[min(realtf_()) max(real(fo_(D))]) 
figureiimshowtrealth0_) minGrealho_(C)) max(realtho_())]) 






3. 结果 展示 
(a) 原始 图 像 FUm,m) (b) PSF 图 像 Am,m) (c) 受 污染 的 图 像 g(mj, 间 





下 
(四 猜测 的 初始 图 像 (e) 依 复 的 原始 图 像 旧 恢复 的 PSF 狼 像 ， 
图 L6.2-1 


讨论 
实验 结果 显示 ， 夺 代 盲目 去 卷 积 法 虽然 可 以 正确 地 恢复 原始 图 像 ， 但 是 此 一 方法 有 几 点 
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需要 注意 ; 若 初始 图 像 为 高 英 度 的 图 像 ， 则 恢复 效果 非常 郑 ; 兴 代 中 有 许多 参数 是 需要 慎 选 
的 否则 并 不 确保 选 代 会 收敛 ; 此 外 了 品 声 干扰 的 多 窒 也 是 图 像 选 代 是 否 收 敛 的 重要 因素 之 一 : 
另外 ， 和 迭代 的 次 数 也 是 需要 考虑 的 。 因 此 ,综合 来 说 ， 我 们 必须 常常 从 尝试 错误 中 来 寻 得 答 
案 。 


动手 做 


1. 调整 不 同 的 PSF 图 像 的 大 小 ,重新 执行 此 一 方法 ， 观 察 其 先 代 次 数 与 恢复 图 像 的 关 
了 系 。 
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第 七 音 ”实验 一 图像 压缩 


L7.1 游程 长 度 编 但 


原 理 


在 实际 的 图 像 中 ， 图 像 内 的 像素 间 都 有 相关 性 ， 玛 而 产生 可 以 去 除 的 元 余 性 ， 达 到 图 像 
压缩 的 目的 。 游 程 长 度 编码 (run icngth encoding, RLE) 即 是 直接 利用 此 相关 性 的 压缩 方法 之 
一 ， 其 基本 做 法 是 将 一 连 串 相同 的 数据 以 两 个 字 节 表示 ,, 一 个 代表 字 囊 的 长 度 ， 另 一 个 唱 表 
示 数 据 。 这 一 种 编码 方法 对 于 一 些 特殊 的 图 像 ， 其 压缩 结果 相当 令 人 满意 ， 例 如 小 画家 之 类 
的 绘图 软件 所 产生 的 图 形 文件 部 属 此 类 -。 

不 过 游程 长 度 编码 也 有 一 个 重大 的 缺点 、 那 就 是 大 多 数 相 邻 的 像素 重复 的 次 数 必 须 大 于 
2 才 有 于 缩 的 效果 ， 否 则 压缩 后 的 数据 可 能 比 原 始 的 数据 还 要 多 ! 这 是 使 用 游程 长 度 编 码 最 需 
要 注意 的 一 点 。 


程序 范 合 


1. 目的 
利用 两 组 不 同 的 数据 ， 去 验证 游程 长 度 编码 的 压缩 效能 : 
2. 程序 及 说 明 


%% 程 序 L7_1.m: 游程 长 度 编码 %% 

% 取 一 个 较 不 适合 游 程 长 度 编码 的 图 像 作 范 例 %% 
[map]=bmpreadfL7 18.btap) 

久 一 X(100:220.100:2201; 

RLECKmap) % 执行 游程 长 度 编 码 
吕 取 另外 一 个 适合 做 游程 长 度 编码 的 图 像 再 做 一 次 编码 吧 
[Xmap]=bmpread0L7 1b.bmp”); 

人 gate 

RLE(CXmap) % 执行 游程 长 度 编码 
% RLE.m 

% 羡 数 RLE.m: 游程 长 度 编 码 约 

fnetion [CR,distortion]=RLECOCmapy % CR: 压缩 率 ; distortion: 编 解 码 的 失真 
Image1=Xf1:100,1:100); 嗓 X 为 输入 的 图 剧 
]mage2 一 Imagel ; 
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image_ TDP=Image2t; 


nx=length(image_ID); 
run_len 人 六 1; 
ji 
for 冯 1:1:n0x-]; 
丰 image_1D 人 一 image_1D(i+]1 
mn jlen0)= ran len0)+l; 
else 
data0)=-image 1D(i); 
访 +1; 
run_lenf0 产 1; 
end 
end 
datatj)=image_1D(nxy; 
二 |; 
frj=l:length(run_len); 
or s 一 ]:] :tan en 人 jy 
rec_IDimag(D-data0); 
二 T+]; ， 
en 二 
end 
error=rec_1Dimag(:)-image_ 1 了 Di; 
distortion=normternon) 
Tece_1Dimag; 
dlength(run_len); 
CR=nXV(2*d; 
CR: 


imshow(limagelrnap) 





% 将 原始 图 像 写 成 一 维 的 数据 并 设 为 
% image_1D 


名 将 image_1D 所 包含 的 像素 进行 比 对 
% rn_len 们 记录 相对 应 的 重复 次 数 


% data 们 代表 相对 应 的 像素 数据 


% 此 循环 的 目的 在 于 利用 上 述 所 得 到 的 
狼 重 复 次 数 与 对 应 到 的 数据 ， 重 建 原 始 
弘 数 据 ， 以 验证 此 为 无 失真 编码 


又 计算 出 mn _ len 所 占 的 字 节 数 
又 计算 出 全 部 数据 低 处 理 后 是 压缩 
%% 或 者 是 膨胀 





(a) 不 适合 作 游 程 长 度 编 码 的 图 像 ，CR = 0.646 4 人 b) 适合 作 游程 长 度 编 码 的 图 像 ，CR =9.5969 


图 L7.1-1 
distortion = 0 (表示 无 失 次 ) 





讨论 


由 图 L7.1-1 的 结果 显示 ， 两 个 特 忻 不 同 的 图 像 条 过 游程 长 度 编 码 之 后 ， 有 截然 不 同 的 结 
果 . 图 上 L7.1-1 (a) 的 例子 经 过 编码 之 后 ， 数 据 量 不 但 没有 减少 ， 反 而 增加 了 :; 而 鲍 L7.1-1 (b) 
的 例子 却 有 非常 理想 的 效果 。 由 此 可 知 : 游 翟 长 度 编码 较 适 用 于 某 些 特殊 的 图 像 ， 而 非 适用 
于 所 有 的 图 像 . 且 由 distortion =0 也 可 验证 游程 长 度 编码 为 无 失真 编码 。 


动手 做 


1， 试 试看 用 别 的 图 像 做 游程 长 度 编码 ， 在 做 处 理 之 前 . 先 闫 测 图 像 运 不 适合 做 洲 程 长 度 
编码 ， 并 验证 其 结果 是 否 符合 。 

2. 试 着 以 游 竹 长 雇 编 码 为 基础 进一步 改良 其 缺点 .使 新 的 编码 方式 能 适合 更 多 的 图 
像 。 


EL7.2 应 用 小 波 变换 与 册 量 量化 做 图 像 压缩 


原 理 


本 实验 应 用 小 波 变换 分 频 理 论 ， 将 一 幅 图 像 分 成 数 个 频带 ， 再 分 别 对 其 进行 向 量 量化 压 
缩 。 

由 小 波 分 频 理论 可 知 , 越 低频 的 系数 包含 的 能 量 越 大 . 对 重建 图 像 在 视觉 上 较 重 要 ;相对 
的 ， 越 高 频 的 系数 所 包含 的 能 量 越 小 ， 在 视觉 上 购 较 不 重要 : 所 以 我 们 在 较 低 频带 配置 较 多 
的 压缩 位 ， 以 得 到 较 低 的 失真 ， 而 在 较 高 的 频带 则 配置 较 少 的 压缩 位 ， 以 达到 较 高 的 压缩 比 ， 
如 此 可 兼顾 压缩 比 与 图 像 重 建 的 品质 : 

本 实验 中 向 量 量 化 码 本 均 依 照 L3.2 节 的 LBG 算法 准则 来 加 以 设计 . 





程序 范例 


1. 目的 

将 一 由 图 像 经 过 一 层 小 波 变 换 分 频 成 LLI、LH1I、HL1、HHI 四 个 频 章 .再 分 别 利用 LBG 
训练 其 不 同 频带 的 码 本 cbLL1、cbLH1I 、cbHL1、cbHH] ， 最 后 分 别 进 行 向 量 量 化 - 

2. 程序 及 说 明 


% 程序 L7_2.m: 应 用 小 波 变 接 与 向 量 量化 做 图 像 压 缩 %% 
骂 利 用 LBG 训练 一 层 小 恋 变 换 后 四 个 频 理 的 码 本 %% 
load lena 

LLELILHL,HL1,HHI]=dqwtper2(XX Pior3.37: 
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咯 训 练 LLi 频带 码 本 ， 将 码 本 大 小 设 为 128， 维 度 为 4 叱 
世 -=-0.05; 

mnC 一 128: md=4; 

[cbLL1]=LBGLLLnc,nd, 贡 ; %LBG.m 在 L3.3 节 中 

%% 训练 LHI 频带 码 本 ， 将 码 本 大 小 设 为 亿 ， 维 度 为 4%% 
ne=64;, nd=4， 

[esbLHi]=LBGLH1ncnd,tb); 

冯 训 练 HLI 频带 码 本 ， 将 码 本 大 小 设 为 下， 维度 为 4%% 
DC 一 4, nd 一 4; 

fcbHL1]=LBG(OHL1ncnad ,由 ); 

%% 训 练 HHI 频带 码 本 ， 将 码 本 大 小 设 为 他 ， 维 度 为 16 咯 
nc 一 04; nd 一 16; 

[ceaRHEU=LBGUHH1ncndth); 


% 利用 一 层 小 波 变换 加 上 向 量 量化 进行 Lena 图 像 压 缩 吃 

吧 输 入 一 幅 Lena 图 像 % 

load lena 

[MN]=sizeCxy); 

冯 使 用 Matlab 中 Wavelet 工具 箱 的 周期 性 小 波 变 换 一 数 dwtper2m 咯 
嗓 并 使 用 双 正 交 小 波 bior3.3 进行 一 层 小 波 变换 %% 
[LLLLH1HL1HHI]=dwtper2(Xsbior3.37); 
wt_X(LMV2,1:NA2)-LL1 

wt_X(1MA2 NO2+LND=LHI1; 

wt XUVV2+1:M,1:NA2)=HL1; 

wt 有 (72+1M,N2+TN)=HHI]; 

% 分 别针 对 不 同 的 频带 进行 向 量 量 化 ， 其 中 VQ.m 置 于 3.3 节 中 %% 
[R_LLILbitLLiVQULLILcbLL1D， 
[R_LHELbitLHIFVQCLHILcbLH]T)， 
[R_HLEbitHLI=VQrHLLcbHL1T); 
[R_HHI,bitHHI]=VQ(HHIcbHH])， 

wt_ YU:MA2 ,INA2)=R LL1; 

wt_Y(LMA2,NA2+1:N)=R LHI 

wt_Y(M2+1:M,1NA2)=R HL1 

wt_Y(M2+t:M 2+LIN=R HHI; 

计算 图 像 经 过 向 是 量化 后 的 压缩 比 CR 及 失真 PSNR 鸣 

totalbit = bitLLi+bitLHI+bitHLI+bitHH]; 又 花费 的 总 位 数 
Y=idwtper(R_LLIR_LHER_HLUR_HH]bior3.395; % 反 小 波 变 控 
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MSE=(sumsum((X- TOMYN: 
PSNR=20*log10(255/sqrt(MSE)) 
CR=MeN*8/ntotalbit 


3,. 结果 展示 









(b) 经 一 层 小 波 变换 后 所 得 的 分 并 图 像 ， 
由 左上 、 右 上 、 左 下 、 右 下 分 别 
为 LL1、LHI 、HLI 以 及 HRI1 





人 经 向 量 量化 后 所 得 的 分 频 图 像 还 原 图 ， { 配 经 小 波 反 变 换 后 所 得 的 重建 图 像 
由 左上 、 右 上 、 左 于 、 右 于 分 别 为 
R_LEIL、R_LHI、R_HLI 以 及 RHHI1 


图 L7.2-1 利用 ~- 层 小 波 变换 加 向 量 量 化 进行 图 像 压缩 的 结果 
讨 论 


由 L3.3 及 13.4 节 可 知 , 码 本 的 大 小 越 小 或 维度 越 大 ,其 训练 集 与 码 本 的 平均 误差 越 大 。 
另外 由 图 L7.2-1 (b) 可 以 看 出 ， 经 过 小 波 变换 后 ， 越 低频 的 系数 变动 范围 越 大 ， 故 在 设计 码 
本 时 ， 对 较 低 频带 采用 大 小 较 大 旦 维度 较 小 的 码 本 进行 向 量 量化 。 

又 从 能 量 的 观点 来 说 ， 越 低频 系数 所 包含 的 能 量 越 多 ， 对 图 像 还 原 的 影响 极 大 ， 因 此 给 
耶 较 高 的 传输 位 。 

本 实验 的 结 晤 ,各 频带 向 量 量化 的 压缩 比分 别 为 CR_LL1=4.6 ，CR_LH1=5.33 、 
CR_HL1=5.33 及 CR_HH1=21.33， 最 后 图 像 重 建 的 结果 为 PSNR=32，CR=9.14。 
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动手 做 


LI. 请 改 以 小 波 基 底 “dhb8” 来 进行 小 滤 变 换 . 亦 即 将 程序 中 的 “bior3.3” 改 成 “db8"， 
观察 其 结果 的 差异 。 

2, 试 着 将 cbLL1 的 大 小 设 成 128， 维 度 变 成 1; cbLHI 及 cbHL1 不 变 ; cbHHI1 的 大 小 设 
为 32， 将 维度 设 为 16， 并 观察 其 结果 与 先前 的 差异 。 
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L8.1 像素 聚 类 区 域 成 长 法 


原 理 


顾名思义 ,此 方法 从 一 种 子 像素 开始 , 通过 如 平 多 艾 度 . 组 织 纹理 及 色彩 等 性 质 的 判断 ， 
将 具 类似 人 性质 的 像素 逐一 纳 人 所 考虑 区 域 中 ， 使 此 区 域 由 种 子 逐 渐 成 长 成 一 个 性 质 相 似 的 图 
侧 区 块 。 

最 简单 的 做 法 是 以 一 个 种 子 像素 为 基础 ， 并 设 定 一 个 像素 差 临界 值 ， 若 邻近 像素 差 值 小 
于 或 等 于 此 临界 值 ， 则 将 此 邻近 像素 纳 人 此 区 块 内 .借助 此 方法 的 不 断 向 外 迭代 聚 类 区 域 成 
长 ， 可 得 到 像素 值 相似 的 图 像 区 块 。 


程序 范例 


1， 此 的 
将 像素 差 临 界 值 设 为 0， 随 意 取 一 种 子 点 ， 观 察 其 像素 聚 类 区 域 成 长 的 结 黑 。 
2. 程序 及 说 明 


% 程序 L8_l.m: 像素 聚 类 区 域 成 长 法 只 

吧 读 和 人 一 幅 区 域 明 电 的 图 像 ， 实验 像素 聚合 %% 

{ 区 ,map]=bmpreadCL8 1.binp 7》 

seed=f250 200]， 嗓 随 意 设 定 一 个 种 子 点 
[Y_1]= regiongrowfX,seed,0,1000); 。% regiongrow 程序 在 本 实验 范例 中 
[Y_2]= regiongrow(X,seed.0.10000); 

[YY_3]= regiongrow(X,seed,0,inf); 

figure 

subplot(221)imshow(X,map) 

subplot(222jhimshow(Y Imap) 

Subpiot(223j.imshow(Y 21nap) 

Subplot224),imshow(Y_ 3,map) 





% 函数 region 和 rowm: 像素 事 类 区 域 成 长 法 % 
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fanction [image]= regiongrowf( imaege,seedreglioa th,stoplil) 

5 [DO_imagel]= regiongrowll image;seedregion th,stopl) 9 

% L_image : (rowxcol 输入 图 像 吃 

% seed : [yseed xseed] 输入 一 附 合 种 子 的 坐标 多 

%%Eegion 也 :0<=1egion th <=255) 区 域 临 看 值 % 

% stopn ; (0<stopn<=in 有 中 斯 临界 值 :控制 中 新 程序 的 聚合 像素 个 数 % 
%%D_image : (rowxcoD 经 过 像素 吾 类 区 域 成 长 后 的 输出 画像 % 


O_image=L1_ image; 

[rowcol=size( 人 image); 

吕 将 种 子 放 人 队列 中 %% 

YySeed 一 Seed(1); 

XSeed=seedf2)， 

fixel seed=I imagefyseed,xseee); 0% 种 子 的 像素 值 

queue=[yseed xseed]; 听 将 种 子 的 坐标 存放 人 队列 中 
tog 一 1， %% 设 定 队列 年 阵 的 顶端 位 置 


叹 制造 一 个 标注 像素 毗 合 的 矩阵 % 
IEgion_matrix-zerostrowcol; 


IEgion_ matrixfyseed,xseed) 一 1 ， 名 大 判 定 为 相同 区 域 、 则 标注 为 1， 反之 为 0 


%% 开始 像素 聚合 站 
Tegion_ count=1; 妫 制造 一 个 襄 合 区 域 的 计 妆 舌 
while tofr-=0 %% 当 队 弄 撼 阵 中 没有 存 亦 任何 坐标 时 ， 则 停止 循环 


弘 取出 队列 矩阵 中 的 最 底 端 坐标 值 % 
row_buttom=queuer] ,1); 
col_buttom=queuef ji) 
Pixel_buttom=I imagefrow buttomrucol buttormny 
% 以 此 坐标 轴 为 种 子 ， 判 断 周 是 各 像素 是 否 属于 相同 的 区 域 % 
Tegionedge=0; 
吧 设 一 个 判 浙 是 否 为 区 域 边缘 的 指标 % 
far 计 -]1:1 
forj=-1:1 
计 row_buttom+i<=row 庶 TI0w_buttomHi>0 度 .. 


coL buttomfHi<=col 下 eol buttomT+j>0 
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这 abs(d_inage(row_buttom+icol_burtom+j)-pixel_buttom]… 
<=Tegion 也 康 Tegion matrixfrfow buttom+ibcoL buttonmtjy 一 ] 
%% 落 像素 之 间 的 差 值 小 于 区 域 临 界 值 ， 则 判定 为 园 一 区 域 %% 
tp 一 top+1i 冯 队列 抢 泗 顶端 top 值 增 加 1 
总 将 此 像素 坐标 存 人 队列 矩阵 的 耿 端 % 


queueltop,:)F[frow_buttom+i col_ buttom+j]: 


tegion_ inatrix(row_buttom+icolL buttomH 六 -10 标注 为 1 
TeESgion_ Count=region count+1]l; 
5 将 放 人 队列 的 像素 值 均 先 内 设 为 0 嗓 
OD_ imageftrtow_buttom+icol buttomTHj)0; 
end 
这 region matrixfrow_buttom+icol buttomH 产 -0 


regionedge=]; 名 羯 断 为 区 域 边缘 
end 
el]88 
TEgionedge=]1; 5% 判断 为 区 域 边缘 
end 
end 
end 
%% 将 判断 为 非 聚合 区 域 边缘 的 像素 值 用 种 子 的 像素 值 取代 %% 
这 regionedge~ 一 | 


人 imageftrow_buttontcol_ buttotm 广 [ image(yseed,xseed); 
end 
% 车 计数 值 大 于 或 等 于 所 设 定 的 中 断 临 界 值 ， 则 将 不 再 进行 育 合 循环 % 
让 tegion_count>=stopn 
toOP=]; 
end 
嗓 将 已 经 做 完 聚 合 的 坐标 众 队 列 矩阵 中 删 去 % 
queue=queue(2:top, 站 
top=top-1; 
end 


O_image(yseed,xseed)=0; 名 将 种 子 像 素 值 设 为 0， 即 黑色 
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3. 结果 展示 





(b) 种 子 点 ，seed=(100,100) 





背 : 


(es) 设 定 当 到 类 区 域 成 长 的 像素 个 数 达 1 000 时 ， (成 长 完成 的 结果 
所 得 的 图 像 ， 其 中 票 线 为 此 区 域 的 边缘 线 


“图 L8.1-1 像素 聚 类 区 域 成 长 过 程 图 


从 图 工 8.1-1 可 以 看 出 ， 像 素 聚 合 方法 可 以 成 功 地 找到 像素 性 质 相 似 的 区 域 ， 并 将 其 边界 
找 出 ， 因 此 ， 此 方法 极 适用 于 检测 边缘 明显 的 图 像 区 卖 。 

必须 要 注意 的 是 判断 邻近 像素 是 否 属于 同一 区 块 的 临界 值 的 选 定 极为 重要 ， 若 选 得 过 
大 ， 则 像素 过 度 育 合 ， 反 之 ， 若 临界 值 选 择 过 小 ， 则 聚合 不 够 ， 两 者 都 无 法 忠实 反映 出 该 图 
像 区 块 的 真实 形状 。 


动手 做 


1. 请 另外 随意 输 人 一 个 种 子 点 坐标 ， 观 察 其 像素 聚合 的 过 程 。 
2. 利用 一 幅 不 同 于 本 实验 所 采用 的 图 像 ， 重 复 上 题 的 实验 ， 并 尝试 加 大 判断 邻近 像素 是 
否 属于 同一 区 块 的 临界 值 ， 观 察 其 结果 的 差异 。 
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L8.2 ”四 叉 树 区 域 分 割 与 合并 法 


原 理 


首先 将 图 像 分 割 成 不 重合 的 区 域 ， 其 中 最 常用 的 方法 是 分 割 成 四 个 大 小 相同 的 子 图 像 。 
若 每 个 子 图 像 内 有 性 质 不 同 的 图 像 存 在 就 将 该 子 图 像 继续 分 割 ， 持 续 这 个 过 程 直到 没有 可 再 
分 割 的 条 件 为 止 。 接 着 将 具 同 性 质 又 相 邻 的 子 区 域 进行 合并 ， 直 到 无 法 再 合并 为 止 ， 整 个 图 
像 分 割 程序 才 算 大 功 告 成 。 


程序 范 乌 


1.、 目 的 
使 用 四 又 笛 (quadtree) 的 方法 ， 来 找 出 图 像 中 物体 的 轮廓 。 
2. 程序 及 说 明 


阁 程 序 L8_2.m: 隔 叉 树 区 域 分 割 与 合并 法 % 

imagel=imread0L8 2.bmpy: % 读 取 图 像 

s=dtdecompfimage1.0.1》  %% qtdecomp 就 是 “四 又 树 分 解 ”函数 
%%0.1 是 每 个 方 抉 所 项 达 到 的 最 小 差 值 

itmage2= 扣 ls); 色 由 于 s 变量 为 sparse ( 生 朴 ) 矩阵 ， 故 我 们 使 用 fll 

% 指令 来 将 s 矩阵 中 缺少 的 elemett 补 上 ， 以 便 可 

% 用 图 僚 显 示 出 来 ， 新 的 矩阵 值 存 于 image2 中 

imshowfimage1y; %% 将 原 图 像 显示 出 来 

fgure,imshowfimage2) 吃 将 加 又 树 分 解 处 理 过 后 的 图 像 显 示 出 来 





出 ) 经 过 四 叉 树 分 解 处 理 过 后 的 结果 
图 L8.2-1 
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讨 论 


图 L8.2-1 的 独立 亮点 都 是 四 叉 树 分 割 块 中 左上 角 的 位 置 , 由 此 可 体会 出 此 方法 的 中 间 结 
洒 。 最 后 可 将 独立 亮点 视 为 噪声 ， 用 简单 的 后 处 理 方法 (例如 : 中 值 滤波 ) 将 其 册 除 。 


动手 做 


1. 改变 每 区 典 所 和 希 达 到 的 最 小 善 值 ， 对 处 理 结果 有 何 影响 ? 
2. 对 一 个 8 位 的 灰 度 图 像 image、s = qtdecompfimage,0.1 中 的 0.1 代表 实际 上 灰 度 差 是 
多少 ? 


L8.3 ”Sobel 边缘 检测 


原 理 
对 于 一 张 暗色 背 最 下 有 亮 条 纹 的 图 像 . 由 水 平 扫描 线 的 灰 度 前 面 图 及 其 一 阶 导 数 图 可 追 
现 一 个 边缘 ， 这 就 是 边缘 检测 的 基本 理论 。 图 像 As 站 的 一 阶 候 导数 与 梯度 有 关 ， 即 


W = 区 生 基 人 -CH+G。 樟 度 向 量 的 方向 是 /在 (x 处 变化 最 大 的 方向 ， 在 边缘 检测 中 


一 个 最 重要 的 量 是 这 个 向 量 的 大 小 ， 即 1YF= JG: +G，， 为 计算 方便 通常 近 做 为 








YASGs +TGC| (L8.3-1) 
对 Sobel 运算 而 言 
G.=(Z,+2Z +Z)-(Z+27.+2Z)) (L8.3-28) 
= (ZI+2Z,+Z)-(Z+2Z,+2Z)) 人 L8.3-2b) 
其 中 局 ,zw2 的 位 置 请 参考 图 18.3-1。 
- 
马 | 2 五 
马 Z 筷 
-一 一 | 一 上 一 一 下 
2 轧 五 




















廊 L8.3-1 3x3 图 像 方块 
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对 算出 的 梯度 大 小 取 一 临界 值 ， 大 于 临界 值 的 像素 设 为 1， 表示 边缘 像素 ， 友之 为 0， 
表示 背景 像素 。 


程序 范 倒 


1, 目的 
给 一 张 图 像 以 Sobel 算法 进行 边缘 检测 。 
2. 程序 及 说 明 


. % 程序 L8_ 3.m: Sobel 边缘 检测 骂 
[imasgemap]=bmpread0L8 2.bmp'; 
imagel=sobelfimage,0.3); 
image2=sobel(image;0.6); 
Image3=SObelfimage:0.7; 
imshowfimage:map) 
figure,imshowfimagejy 
figure,imshowlimage2) 
gure,imshowfimage3) 


吃 图 数 sobelm: sobel 算 子 %% 
fnction ysobelfimage, 由 ) 
% image: 输入 图 像 % 

%% 也 : 虱 界 值 唉 


[Nn Nm]=sizefimage): 狼 图 片 大 小 
h=[-1 -2 -10001 2 1 % Sobel 算 子 
Gx=filter2fh,image); % 得 梯度 向 量 的 Gx 分 量 
Gy 一 filter2(h simageh % 得 梯度 呵 量 的 Gy 分 量 
FE=absfGxy+absfGY)i 
Bw _Gx=double(Gx)/255; % 将 Gx 范 围 从 [96，255] 缩 到 [0,1] 
Bw Gy-double(Gy)/255; 咒 将 Gy 范围 从 [0，255] 缩 到 fo0,]] 
Bw_F=double(F)/255; 站 将 F 范 围 从 [0，25 引 缩 到 [0.1] 
双 设 年 临界 值 ， 在 01] 之 间 
for ij=1:Nn 
for j=1Nm 
了 f Bw_FGj)<th 
YN)=0; 
else 


yy 大 1 
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end 
end 
en 


3. 结果 展示 





(c) 临界 值 也 =0.6 fd] 临界 值 ih= 站 7 
L8.3-1 





讨论 


若 要 设 定 临界 值 ， 首 先 要 看 直方 图 的 分 布 ， 看 看 像素 值 的 分 布 ， 寻 找 其 分 界 的 地 方 为 临 
界 值 ， 以 本 图 像 为 例 ， 差 不 多 取 到 0.5， 其 边缘 效果 就 已 经 很 明显 了 。 


动手 做 
1. 对 上 例 的 原 图 像 作 直 方 图 均衡 化 ， 并 重 取 一 个 临界 值 ， 作 Sobel 边缘 检测 ， 使 其 边缘 


效果 更 明显 。 且 的 可 达到 吗 ? 为 什么 ? 
2. 分 析 临 界 值 和 边缘 效果 的 关联 性 。 
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L8.4 拉 氏 边界 检测 法 


原理 


二 维 图 像 函数 /zx 妨 的 拉 式 算 子 是 一 个 二 阶 导数 ， 其 基本 要 求 是 与 中 心 像素 点 相对 应 的 
模板 系数 必须 为 正 ， 与 外 围 的 像素 点 相对 应 的 系数 必须 为 负 。 对 于 一 个 3 x3 的 区 域 . 在 实际 
应 用 中 最 常用 的 计算 方式 是 


V? 太 =4Z, -(Z:+Z,+Z+Z) (L8.4-1) 


到 18.4-1 是 实现 (8.4-1D) 式 的 空间 模板 . 














图 L8B,4-{ 实现 拉 式 运算 的 空间 模板 


尽管 拉 式 算 子 对 于 亮度 转变 (例如 边缘 ) 很 敏感 ， 但 却 很 少 用 于 实际 的 边缘 检测 ， 因 为 它 
对 品 声 有 不 可 接 党 的 敏感 性 ， 会 产生 双边 缘 并 且 不 能 检测 出 边缘 的 方向 。 要 降低 到 声 的 影 
喇 ， 可 先 做 平滑 处 理 。 而 最 好 的 选择 是 具有 Gaussian 脉冲 响应 的 低 通 证 波 器 ， 其 函数 形式 
是 








2G” 


px 让 = 串 一 区 十] ] -84 
其 中 c 值 是 标准 差 ， 令 天 = 姑 + 太 ， 天 对 > 到 二 阶 导数 得 (也 是 无 的 Laplacian 算 子 ) 得 
V 了 2 = - 开 3 (L8.4.3) 
三 2 1 


就 成 了 拉 氏 一 高 斯 滤波 器 的 响应 。 





程序 范例 


1. 此 的 
对 一 张 图 像 以 二 维 的 拉 氏 一 高 斯 算 子 来 显示 图 像 的 边缘 . 采用 不 同 的 c 值 来 运算 ， 并 比 
较 其 差异 。 
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2. 程序 及 说 明 


% 程序 L8_ 4.m: 拉 氏 边界 检测 法 % 

[image map]=bmpread(L8_4.bmpy》; % 读 取 图 像 

image_edge_1=edgefimage,log' 昌 27 名 使 用 边缘 检测 中 的 越 零 点 检测 ， 其 中 [ ] 是 空 符 阵 ， 
%% 其 edge 函数 会 自动 检测 最 敏感 的 临界 值 ， 2 是 上 值 

image_edge 2= edge(imagevlog',[], 和; % 同上 ， 不 过 口 值 为 4 


imshowtimage,map) %% 显示 原 图 像 

figure,imshow(image_ edge 四 %% 同时 显示 闻 值 为 2 的 图 像 

fgure,jmshowfimage edge 2 又 同时 显示 囊 值 为 4 的 图 像 
3. 结果 展示 





(gj T=2 的 结果 人 b) =2 的 结果 
于 18.4-2 ”以 拉 氏 一 高 斯 算 子 及 越 零 检测 作 边 练 检测 


讨 论 


要 使 图 像 的 亮度 变化 剧烈 且 噪 声 相 对 要 低 ， 梯 度 算 的 边缘 检测 才 可 以 做 得 很 好 。 此 外 ， 
由 越 零点 可 得 一 个 可 靠 的 边缘 位 置 ， 且 V 扩 的 平滑 特性 降低 噪声 的 影响 ， 同 时 使 图 像 模糊 的 
程度 正比 于 ca 。 
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动手 做 


1. 证 明 由 (8.4-3) 式 所 给 的 拉 式 算 子 Yi 的 平均 值 为 零 。 
2. 在 原 图 像 上 加 人 高 斯 或 胡椒 盐 的 噪声 ， 以 范例 的 程序 处 理 ， 并 讨论 其 结果 。 


L8.3 LUM 滤波 般 


原 理 


关于 LUM 滤波 器 的 原理 请 参考 本 书 的 8.4 节 。 值得 注意 的 荐 平滑 参数 大 越 大 , 平滑 的 效 
果 越 明显 ; 又 当 锐 化 参数 ! 值 越 小 ， 锐 化 程度 越 高 。 借 助 通 当 的 参数 选取 ，LUM 滤波 器 可 同 
时 当做 平滑 滤波 器 及 锐 化 滤波 器 。 


程序 范例 


1. 目的 
将 一 幅 图 像 如 人 噪声 后 ， 分 别 以 基站 = G.6) 以 及 @,12) 做 LUM 滤波 ， 并 观察 其 结果 。 
2, 程序 及 说 明 

% 程序 L8_ St LUM 滤 滤器 %% 

吃 对 一 幅 加 噪声 的 图 像 ， 实 验 LUM 滤 波 般 %% 

1oad tena 

Subplot(221),imshowf(Xmap) 


嗓 将 原始 图 像 加 人 噪声 唤 

X=imnoisef(Xssalt & peppen,0.05):; % 加 入 密度 为 005 的 噪声 
Subplot(222),imshow( XInap) 

% 进行 LUM 滤 波 %% 

[Y_k316]=LUMCX,3,.6,3); % LUM 函 数 在 本 范例 中 


Subplot(223),imshowfY k316.map) 


Fi112]=LUMCCG9,12,5); 
Subplot(224)j,imshowfY _k9ll2:map) 
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% 函数 LUM.m: LUM 滤波 器 %% 

funetion [DO_datal=LUMII datak,lwm 

30 w=inputfplease input window size (sor7)0 模板 龙 小 把 
% k=input(please inpurk parameter:0 平滑 参数 的 

% ]=inputfplease input lparatmeter:) 锐 化 参数 叹 


datal=l_ datai; 

出 1=(w-1J72; 

% 将 原始 图 像 依照 模板 的 斥 寸 扩大 %% 
[MLN]=sizefL data); 

A=H; 

由 =[[ dataf,1:wl) TI qdatai dataf:,N-w1l+tiN]; 
A=[A(lw1A;A(M-w1+1:M 

上 Gata=AA; 


%% 进 行 LUM 滤波 史 


for 11:M 
forj=i 1 
block=I datafiiHw-1jjtw-1》 % 取 一 个 wxWw 图 像 模板 进行 滤波 
b=-sort(block( 站 JJ): 骂 将 此 模板 的 内 容 依照 天 小 排序 
ft-(b(D+btw^2-I+Dy2; 纹 找 出 中 间 值 
吧 诀 定 此 模板 中 心 新 的 数值 冯 


计 I datafti+wljJ+wl<btky 
O_data(j 六 bfk); 

else 这 Idatalitwlj+wlj>bD 让 Idatafit+wli+wiD<=ti 
O_datatij)=b(); 

else 这 1 datafi+wlj+wli>ti 斌 工 datafi 计 ww1jJ+Twly<bfw^2-1+1) 
O_Gatafij=b(Cw^2-]+1) 

elseifbfw~>2-k+lDs<L datafi+w]j+w3y 
O_ datatij)=bfOw^2-k+1); 

人 Se 
马 datatdjjj=L gatati+w1lij+wlY 

end 

end 
eng 
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(0 经 佐 放 = (3.6 的 LUM 滤波 后 的 图 像 ”人 由 经 做 放 = (9 人 的 LUM 滤波 后 的 图 像 
图 1L8.5-1 到 LUM 误 波 后 的 结果 


讨 论 


从 图 L8.5-1 可 以 得 知 ， 当 平 清 参 数 上 设 得 您 大 时 ，LUM 滤波 器 滤 除 噪声 的 效果 也 就 傅 
好 ,但 图 像 中 一 些 变化 较 剧烈 的 部 分 ， 却 变 的 较为 模糊 。 反 之 当 锐 化 参数 ! 设 的 较 小 时 ,图 
像 的 对 比 度 较 明 显 ， 劫 也 可 能 放大 了 噪声 的 效应 。 因 些 我们 可 以 用 互动 式 的 方法 ,适当 巧妙 地 
运用 这 两 个 参数 ， 以 获得 我 们 需要 的 结果 。 


动手 做 
1. 尝试 改变 LUM 滤波 器 平滑 参数 及 锐 化 参数 ， 观 察 其 经 过 滤波 后 的 图 像 。 


2. 改变 原始 图 像 所 加 人 噪声 的 密度 ， 并 利用 相同 的 参数 设 定 进 行 LUM 滤波 ,讨论 与 本 
实验 结果 的 差异 。 
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L9.1 不 变 抑 


原理 


一 个 与 平面 区 域 有 关 的 几何 特性 ， 像 是 大 小 、 位 置 、 方 向 及 形状 等 ， 其 中 很 多 竺 性 与 捉 
这 个 参数 有 关 。 一 阶 怎 与 形状 有 关 ; 二 阶 矩 显示 曲线 围绕 直线 平均 值 的 扩展 程度 ;三 险 矩 则 
是 关于 平均 值 的 对 称 性 的 测量 。 由 二 阶 矩 与 三 阶 垂 可 以 导出 一 组 共 七 个 不 变 算 ， 这 一 组 不 变 
竹 不 受 平移 、 旋 转 和 比例 变化 的 影响 。 





程序 范 铭 


1. 目的 
给 一 张 简单 的 几何 图 形 图 像 ， 分 别 做 斥 寸 大 小 和 旋转 角度 的 变化 ， 观 察 其 七 个 不 变 矩 指 
2. 程序 及 说 明 
叹 程 序 L9_ 1.m: 不 变 上 吼 
Timage map]=bmpreadfL9 1.bmp'); 
invariancematrixt= invariancefimage,1,0): %% 原始 图 像 的 不 变 扼 
invariancetrtiatrix2= invariancetimage,0.50)， 吗 一 半 尺 十 的 不 变 拖 
invariancematrix3= 记 variancefimage,1.90]; 嗓 旋转 90" 的 不 变 矩 
iivariancematrix4= invariancetimage,1180)， 吧 旋 转 180* 的 不 变 官 
imnvarnancematmxl=absfinvanancermatrix1》 
invarancematrix2 一 absfinvariancermatrix2) 
inivariancematrix3=absfinvariancematrix3) 
记 variancetmatrix4=absfinvariancematrix4) 


% 函数 invariance.m': 求 不 变 插 %% 

fonction [inyvariancematrixl=invatiancefitmage,size_orderTotate) 
% imasge: 输 人 图形 %% 

吧 sizs_order 图 形 的 放大 倍率 % 

w% rotate: 图 形 旋转 的 角度 嗓 
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% invarianeematrix: 计算 出 的 不 恋 矩 咏 


X=image; 

[F_x FF_ 习 =size(x 

F=JMRESIZE(X,[fix(F_x*rsize_ordery fx(E_ ysize_ orderi 站 5%% 改变 图 像 大 小 
F=imrotatefEirotate)， % 改变 图 像 角 度 


医 _xF =sizefE); 


%% 求 x 的 平均 值 % 

F_xsum=sumfF,2)， 

temap=] :FT_X; 

tetmp=temp 

Iniean- teInp= 一 temp,*F XSutm 

mean x=sumtimnean tenmpysumtsumF)); 


叹 求 y 的 平均 值 % 

F_ysum=suraE,1); 

tmp=1:F 人 区 

mean tembp=tenmp.*F ysunt 

mean y =Sumfimean tempysum(sunaE7); 


骏 求 各 阶 矩 吧 
or p=0:3 
for q=-0:3 
YP+1,q+TD)=(p+Qqy2+1i 
X 一 1T:FE_X; 
X=X-TmIEan XI; 
XXX hi; 
1 了 有 
7 一 Y- 卫 ean y; 
yyY“gi 
U_tefmnp 一 xyY; 
Up+1q+1)Fsum(sumtu temp.*F7))i 
end 


end 
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嗓 标 准 中 心 矩 嗓 


TY=uAutl, 1) Ar; 


5% 七 个 不 变 矩 % 
invariancetmgatrx(T,1)=1logl0Otabstnt3 1)+HnCE 3 
imvarimncematrxf]l,2)j=logi0Ofabst(nf3,1)-01 .372+49m(2 2 2 
inyariancematrxft 1,3)=Ilog10Otabsf(n(4,1)-3*n(23) 2338mL32-n 1 .47 2 
invariancematrxf1,4)=logl10(absft 人 nt4,1)fn(2.3))^2+(n(3.2)7Hn(1 47 ^2))， 
invarianceimatrx(1.5 关 1og10fabs((nf4.1)-3+nf2.37*0n(4,Hn237YOnC4 ,17n237 2-380nf3 2 
RUL4) "23n(32)nL4DYnG HTn0 4 n(41Hnt23 2-0n(32Tn(4 有 7 2) 
也 yariancematrx0 ,6)=iog10fabstfnf3,E)-n01,37)*f0nt4.1)ytHnaf2.37). “2-fn(3,21Hn(1 427H4sn(2.2)* 
Cn DTa(2 na(3.2)tn(147)) 
invariancematrx(l,7)j=]og100absf(3+n03,2)-n0 .47D8n(4,1)Hnf2378YTOn4 1)Hnf2.37 “2-3840n(3.2)+ 
4 2)+Gn(23)-n(41D Cn(32)+n(1 4 Sn(4 HTnC2 3 -Cn(32HnC1 4 2 


3. 结果 展示 


(9) 原始 人 b) 一 半 扩 才 to) 旋转 90* [qd 旋转 180* 
图 .9.1-f 简单 的 几何 图 形 





讨 论 


因为 所 得 的 不 变 矩 动态 范围 很 大 ， 所 以 取 1log 侈 | - 另外 ， 为 了 方便 起 见 取 正 值 . 由 表 
L9.1-1 所 列 结 果 显 示 ， 所 得 的 七 个 不 变 矩 很 相似 ， 验 证 了 不 变 矩 的 确 是 不 受 旋转 及 大 小 比例 
履 变 的 影响 。 表 工 9.1-1 中 同一 行 函数 值 间 的 误差 主要 来 自 于 数据 的 离散 化 特性 以 及 计算 精度 
的 效应 : 


表 (19.1-1 三 种 变化 的 不 变 矩 















1 = 了 1 一 3 1 站 
1.0469 | 65650371 | 7.7437 [ 
1.0471 | 560024 7.6888 | 和 0228 
6.0371 | 7.7437 | 6.0324 
6.0336 | 75796 | 





工 一 和 1 看 了 一 了 

13.0974 | 9.0552 | 13.0746 
13.0574 | 9.0281 | 13.0430 
12.7744 | 9.0552 | 12.9919 
6.0360 | 12.9763 | 90558 | 13.0591 





不 变 抵 ea 可 | 
原 始 

















一 半 尺 十 
旋转 9%0? 


因为 不 变 矩 不 爱 旋 转 及 大 小 的 影响 ， 我 们 可 以 将 其 利用 于 识别 二 维 或 三 维 物 体 。 不 过 这 
些 不 变 邱 并 不 是 以 区 别 所 有 的 形状 ， 而 且 对 噪声 很 敏感 。 
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动手 做 


1. 试 随意 用 一 幅 图 像 ， 利 用 上 述 程 序 求 出 经 过 不 同 角度 及 尺寸 的 变化 后 的 七 组 不 变 年 . 
看 看 七 个 不 变 抑 的 值 是 否 相 同 ? 
2 试 写 出 一 幅 图 像 经 任意 平移 后 的 七 组 不 变 矩 ， 看 看 七 个 不 变 矩 的 值 是 否 相同 ? 


L9.2 细 化 


原 理 


在 光学 文字 识别 中 , 细 化 可 以 保留 文字 的 信息 ， 并 消除 多余 的 数据 量 - 经 细 化 后 的 文字 ， 
用 各 种 表示 法 和 撒 述 法 来 对 这 些 骨 架 字 体 做 编码 的 工作 比较 方便 。 在 印刷 字 、 手 写字 的 识别 
及 光学 干涉 条 纹 的 辨认 算法 中 ， 每 一 笔划 或 条 纹 的 宽度 .对 于 辨认 的 工作 并 无 帮助 ， 反 而 造 
成 辨认 上 的 国难 。 因 此 使 用 细 化 将 不 等 宽度 的 字体 或 条 纹 细 化 成 等 宽度 的 像素 连 线 后 ， 有 助 
于 进一步 辨认 的 工作 。 有 关 肯 架 的 定义 及 本 实验 所 担 的 细 化 算法 ， 请 参考 本 书 9.1-4 节 。 另 
外 ， 也 可 利用 Matlab 中 erode 函数 中 “thin” 的 功能 来 进行 细 化 的 过 程 。 


程序 范例 


村 目的 
给 一 张 简 单 的 几何 图 形 图 像 ， 分 别 做 尺寸 大 小 和 旋转 角度 的 变化 ， 观 察 其 七 个 不 变 拭 的 
变化 。 
2. 程序 及 说 明 
冯 程 序 1L9 2.m: 细 化 嗓 
[imagc,mapl]-bmpread(L9 2.bmp) 5% image 像素 值 为 1 或 2 


image=image-]; % 原 图 像素 值 说 为 1 或 0 
x=doubletimage); 史 将 图 像 变换 为 double 裙 式 
check=0; 
while check==U 

[y countI]=thinfx,1); % fype =1: 做 一 次 东南 边界 的 细 化 

[x count2 ]=thinfy,2)， 骂 type =2: 做 一 次 西北 边界 的 细 化 

让 (countl&count2T 一 0 % count 1=0, coutnt2=0: 表 示 细 化 完成 

Check 二 1， 

end 

engq 
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yl=logicalfuint8(troundfy))y; 吧 将 图 像 变换 为 unitg 的 格式 
imshowty]) 冶 显示 图 形 


%% 天 数 thitum: 细 化 的 

儿 fpe=1: 做 一 次 东南 边界 的 细 化 站 
% fype=2: 做 一 次 西北 边界 的 细 化 响 
5%X: 输 人 图 像 % 

% y: 输 出 图 像 % 

% count =1: 已 做 细 化 呈 

% count =0: 没 有 做 细 化 %% 


fnction [ycount]=thin(xtype) 
Exixj]j-sizelx; %% 图 像 大 小 
Diask 一 zetfos(xi,xh): 
for ji=2:(xi-]) : 
forj=2:00-T) 
这 XU 
8 一 咎 1=xfijjip2 一 Ki-15P3 一 xfifr1j-17P4=xf 计 1 
PS=xfi+lji+rlypo=xtij+1y 
p7T=xG-1j+TDip8=x(G1j)p9=xG-Tj-D; 
b=[p2 p3 p4 p5 p6b7 p8 p9 p2];[nr hm]=sizetb); nu=sUmD(1:8) 


for u=l:nm-1l 
让 (bfu+l)-btom)<0 
SS 一 8 十 上 
enq 
end 
让 tyPe= 一 1 
11=p2*p4*p6; 5% 东边 界 的 判别 
12=p4*p6*p8; %% 南边 界 的 判别 
elseiftyPpe= 一 2 
1=p2*p4*b8; 0% 北边 界 的 判别 
12=p2*p6*p8;， %% 西边 界 的 判别 
end 
让 人 <=ma 康 n<=6 广 s 一 1 让 11=-0 让 王 = 一 0 
maskijpl; %% 满 足 上 式 刚 p1=0 


CQOuUnt=1; 
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elSe 
coOuUnt 一 省 
end 
end 
end 
end 
了 = X-InasKk; 


3. 结果 展示 





{a) 蛛 狠 像 





人 也) 直接 执行 细 化 程序 的 结果 {o] 利用 erode 尊 数 中 *thin” 的 功能 将 
原 图 像 腐 铀 15 次 的 结果 
图 L9.2-1 围 像 细 化 


讨 论 


应 图 1L9.2-1 可 发 现 当 用 erode 冰 数 库 里 的 thin 来 腐蚀 以 达到 细 化 的 效果 时 , 在 文字 交 盔 
的 部 分 会 产生 线条 扭曲 。 这 是 因为 在 前 几 次 腐蚀 的 时 候 ， 在 文字 交 释 的 部 分 较为 肥大 之 故 : 
依照 细 化 方法 写 册 的 程序 较为 方便 ， 不 用 知道 需要 使 用 几 次 ， 便 可 得 到 结果 ， 而 且 没有 线条 
扭曲 的 现 锭 。 


动手 做 


1. 试 只 以 东南 方向 进行 细 化 ， 比 较 其 图 形 与 图 L9.2-1 他) 的 差异 。 
2. 试 只 以 西北 方向 进行 细 化 ， 比 较 其 图 形 与 图 L9.2-1 避 ) 的 差异 。 
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EL9.3 ” 脱 胀 和 腐蚀 
原 理 


腐蚀 ， 对 于 整数 构成 的 集合 8 和 3$ 而 言 , 日 补 S 腐 闻 . 用 3898S 表示 ， 定义 为 
了 四 GS={xz|(S) ES B ， 也 就 是 被 3 腐蚀 的 如 是 S 平 移 x 之 后 包 食 在 中 由 的 所 有 点 的 集合 . 

及 耿 : 若 了 被 3 腾 胀 ， 记 为 且 电 3， 定 义 为 耻 昌 S$= 和 | (9 六 了 产后 ， 其 中 8 为 S 的 对 
像 或 反射 ， 也 就 是 说 将 9 对 它 的 原点 进行 反射 : 如 被 $ 的 膨胀 是 所 有 可 以 便 8 的 反射 在 平移 
x* 后 与 召 仍 有 非 空 交 集 的 的 集合 。 




















程序 范例 


1， 有 目的 
了 解 膨 胀 与 腐蚀 对 图 像 的 实际 效应 。 
2. 程序 及 说 明 


% 程序 L9 3.m: 膨胀 与 腐 侠 嗓 

imagcl=imreadfL9 3.bmp); 品读 取 间 图 像 

S=ones(3,8b; 吧 设 S 为 一 个 3xl 的 结构 元 素 
image2=erodefitmagel SS7 %% 将 原 图 像 用 $ 做 腐 钠 
image3=dilatefimagel,S); %% 将 原 图 像 用 $ 做 膨胀 





imshowfimage1) % 显示 原 图 像 

人 gure,jmshow(image2) % 弄 示 蕊 腐蚀 的 岁 像 

figure,imshowfimage3) %% 亚 示 已 膨胀 的 图 像 
3. 结果 恢 示 


引 永 昌 
和 1 徐 逢 铝 上 其 浊 
坚 仁 安 戎 伍 乞 扶 公 有 诺 
长 答 风 诚 - | 上 量 关 


贱 交 只 中 你 只 
了 全 站 姚 景 升 卫 企 明 姚 时 开 


{a) 原 图 符 他 ) 嵌 蚀 的 结果 





图 L9.3-1( 待 续 } 
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(e) 彤 胀 的 结果 
围 1L9.31( 续 ) 
讨论 
由 图 L9.3-1 可 看 出 ， 有 彤 胀 使 字形 变 宽 ， 腐 蚀 使 其 变 窗 ， 完 全 符合 我 们 的 直觉 。 
动手 做 


1. 设计 5x1 的 结构 元 素 8$， 百 对 图 像 做 膨胀 与 麻 独 ， 并 比较 其 结果 。 
2. 设计 1xl 的 结构 元 素 3， 再 对 图 像 做 膨胀 与 腐蚀 ， 并 比较 其 结果 。 


L9.4 断 开 与 闭合 


原 理 


断 开 (Opening) 通常 是 平 请 图 像 轮 席 ， 截 断 这 的 细 颈 ， 消 除 细 的 分 文 。 闭 合 (Closing) 也 
倾向 于 平滑 轮 廊 部分， 不 过 与 断 开 是 相 肥 的 。 一 般 来 说 ， 它 把 罕 的 中 断 部 分 和 长 的 细 缺 口 连 
接 起 来 ， 消 除 小 洞 ， 填 补 轮 亡 上 的 缺口 。 集 合 召 被 结构 元 素 $ 断 开 ， 记 为 有 es。S ， 定 义 为 

有 ooS = (后 引 四 了 {L9.4-]) 
亦 即 号 被 3 断 开 就 是 先 被 3 窗 蚀 之 后 再 被 3 膨胀。 集合 召 被 结构 元 素 $ 闭 合 ， 记 为 Be3 ， 
定义 为 

Bay = 人 四 由 人 (L9.4-2) 
亦 即 吾 被 3 闭合 就 是 先 被 $ 脱 胀 之 后 再 被 3 腐 性 。 


程序 范例 


1， 用 的 
了 解 断 开 与 闭合 对 图 像 的 实际 效应 。 
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2. 程序 及 说 明 


名 程序 L9 4m: 断 开 与 闭合 %% 


强 断 开 嗓 


HB=imread(IL9 4a.bmp 7”; 


S=ones(3,3); 

Cerodef 了 ,3 27 

4d=dilatefce,S,2)， 

tmshow(B) 

figure,imshowfec) 

有 EDrelimshowtd) 
又 闭 合 %% 


B=imread0L9 4b.bmpy; 


S=Onesf3 .3 
c=dilate(B,S,2); 
derodefc, 2) 
figure:imshow(B) 
figureimshowtc) 
fgure,imshow(d 


3. 结果 展示 


% 读 取 图 像 


铝 设 S 为 一 个 3x3 的 结构 元 素 


% 将 图 像 用 S 腐蚀 两 次 
%% 将 图 像 用 9 由 胀 两 次 
弘 显 示 出 原 图 像 


% 显示 出 将 原 图 腐蚀 两 次 的 图 像 


% 显示 最 后 结果 玫 像 


%% 读 取 图 像 
匆 设 8 为 一 个 3x3 的 结构 元 素 
% 将 图 像 用 S 用 胀 两 次 
% 将 图 像 用 8 腐蚀 两 次 
% 显示 原 图 像 

冯 显 示 将 原 图 像 膨胀 两 次 的 图 像 
%% 显示 最 后 处 理 完毕 的 图 像 





(a 麻 图 像 


fb) 先 腐蚀 两 次 的 结果 





(c) 断 开 的 结果 
图 L9.4-1 
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(a) 原 图 像 (b) 膨胀 之 后 的 结果 





(c) 闭合 完成 后 的 图 像 
图 L9.4-2 


讨论 
由 图 I9.4-1 与 9.4-2 可 以 看 出 断 开 与 闭合 对 图 像 的 处 理 效果 。 值得 注意 的 是 ， 当 我 们 用 

断 开 来 处 理 图 像 的 时 候 ， 有 可 能 将 我 们 不 想 去 除 的 较 细 徽 处 请 除 ， 反之 用人 也是。 所 以 当 我 

们 要 用 断 开 与 财 合 来 处 理 图 像 的 时 候 ， 要 慎重 选择 所 要 处 理 的 图 像 。 

动手 做 


1. 在 闭合 程序 中 ， 改 为 先 及 胀 五 次 再 腐蚀 五 次 ， 并 比较 其 结果 。 
2. 在 断 开 程 序 中 ， 改 用 5x5 的 结构 元 素 $ 去 腐蚀 脱 胀 ， 并 观察 其 结果 。 
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第 十 章 ” 实 验 一 一 图 像 模式 识别 


LI10.1 利用 不 变 抢 判定 图 形 类 别 


原 理 


一 个 平面 图 形 的 几何 特性 ， 如 大 小 、 位 置 、 方 向 与 形状 等 ， 有 一 些 特性 与 电 有 关 ， 其 中 
经 由 二 和 阶 和 矩 与 三 阶 窍 可 以 导出 一 组 七 个 不 变 矩 ， 这 组 不 变 撼 对 于 平移 、 旋 转 及 大 小 的 变化 不 
敏感 。 虽 然 计 算 上 的 误差 会 造成 少许 差 漠 ， 但 一 般 而 言 不 变 的 特性 相当 明显 。 以 三 类 基本 和 莘 
单 的 几何 图 形 (已 知 明显 分 类 ) 为 训练 资料 ， 对 每 一 类 图 形 计算 不 同 (大 小 、 位 置 与 旋转 角度 ) 
所 得 的 七 个 不 变 邱 ， 分别 计算 各 类 别 的 平均 向 量 癌 ,及 协 方差 息 阵 C，， 作 为 各 类 图 形 的 特征 ， 
输 人 不 同 ( 待 判别 ) 的 图 形 ， 以 高 斯 图 像 模 式 的 贝 氏 分 类 器 判定 出 此 图 形 的 正确 炊 别 。 整 个 方 
法 描述 如 于 。 


Di(9=-5ajc|-5 攻 -mycre-m] CI04.D) 


将 待 判 别 医 形 的 七 个 不 变 下 向 量 x={ 侧 ]- .输入 (L10.1-0 式 计算 (9) 值 ， 取 最 大 万 ( 熙 
值 ， 则 该 图 形 即 可 判定 成 第 类。 

执行 步 聂 ; 

(1 输入 训练 集 图 形 ， 计 算 多 ， 再 计算 出 各 类 别 的 下 ,及 忆 ，- 

(2) 输入 待 判定 图 形 ， 分 别 计算 万 |( 划 。 

(G) 比较 出 , 09 的 大 小 ， 设 找 出 最 大 者 为 Di (x) ， 则 此 图 形 判定 为 第 天 类 。 


程序 范例 


1. 月 的 
计算 出 三 师 图 形 的 七 个 不 变 宅 ， 并 利用 这 些 不 变 矩 判断 出 新 输 人 图 形 的 类 别 。 
2. 程序 及 说 明 


冯 虱 序 LI10_1.m: 利用 不 变 抢 判定 几 形 类 别 % 
%% 计算 图 形 的 不 变 抢 嗓 


[Xmap]=bmpread0L10 1.bmbpy; % ipvariancemm 为 工 9.1 的 程序 
CCLJr=invariancem(X.0.1.0); % 将 图 形变 为 原先 的 0.1 倍 ， 并 旋转 0 度 
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CC2,: 产 invariancem(X0.5.30);  %% 将 图 形变 为 原先 的 0.5 异 ， 并 旋转 30? 
CG:)-invariancem(CX,ll80  。 %% 将 图 形变 为 原先 的 1 倍 ， 并 旋转 180" 
C(4,:)Finvariancem(X,I.2.200); 的 将 图 形变 为 原先 的 1.2 倍 ， 并 旋转 200? 
C(5,:)=invariancemfCx,0.8.300)5) % 将 图 形变 为 原先 的 0.8 倍 ， 并 旋转 300? 


C_mean=mean(C); 冶 计 算 五 组 不 变 矩 的 平均 值 
CC_var=eov(t): % 计算 五 组 不 变 矩 的 协 方差 
又 计 算 买 形 的 不 变 矩 % 


[map]=bmpreadfCLtO 1b.bmp7; 
xf ,invatriancemtX .0.1,0); 
X(2,)=invariancem(X.0.3.30); 
X03)=invariancermX 180); 
xf(4,:)invariancem(X,1.2.2007， 
X(S)=inyariancem(X0,300); 
x_Imean=-mean(xy; 


X_VaCOV(X); 


% 计算 椭圆 形 的 不 变 矩 % 
[Ximap]=brmpreadCL10 1cbrmp); 
EC )invatiancenm(X ,0.1,0); 

EL, 一 invariancernfX ,0.5.30)3 
E(3,: 六 imvariancem(X 1180); 
E(4,:)Finyarnancetm( 有 1.2.2007 
ES,:invariancem(X,0.8.300)， 
PE_mean=mean(Ey》 


王 _YaI=COV(EY 


%% 输 和 一 个 待 测 图 形 ， 并 判断 其 类 别 嗓 
[X:map]=bmpreadCLI10_1a.bmp?; 5%% 圆 形 

吧 [Xmap]=bmpreadCL1I0 lb.bmpy》 缉 基 形 
%% [Ximap]=btmpreadoL1I0 1c.bmp)，， % 栏 圆 形 


tl=inyvariancem(X,0.7.0); 嗓 找 出 这 个 待 测 图 形 的 七 个 不 变 纸 
D(F(-172 关 logmtdettC_vanD)-(172)*(t-C_ meatm)*invfC_var#ttl-C_ mean)) 
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De2:)=(C12ilogmfdet(x_ yar)-(172)xtLX meanyyinvfX YariyttI-X Ineany 
DO,:)=(-172)#]lopgmtdetE_ varjj-(1A2)+tL-E meanjyinv(E_var*ftl-E Imeany， 


只 找 出 数值 最 大 者 ， 即 判断 为 让 类别 史 
InHXD=TindfD= 一 Dax(D)); 


寺 maxD 一 一 
dispfThis pattern beiongs to cifcle type7) 
Send 


这 PaxD==2 
disp(CThis pafttermn beiongs to Xtype) 
enmd 


让 maxDe= 一 3 
dispfCThis pattern belongs to ellipse type7) 


end 


3. 结果 展示 








(a) 第 一 类 的 贺 形 人 ) 第 二 类 的 习 形 





{c) 第 三 类 的 椭圆 形 
国 Lt0.1-1 所 输入 的 三 种 图 像 
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讨论 


由 热 行程 序 的 结果 可 以 知道 ， 椭 圆 形 有 时 会 被 误 判 为 图形 ， 或 圆 形 有 时 候 会 被 误 判 为 权 
圆 形 . 但 和 XX 形 却 不 会 被 误 判 。 若 观察 这 三 种 类 别 的 不 变 矩 便 可 以 发 现 , 男 形 及 椭圆 形 的 不 变 
和 矩 之 间 的 差异 不 大 , 但 两 者 均 和 X 形 的 不 变 矩 有 极 大 差异 。 由 此 可 知 图 形 在 视 党 上 的 差异 越 
大 ， 其 不 变 矩 的 差异 也 就 越 大 ， 相 对 的 也 就 越 容易 被 正确 无 误 地 判断 出 其 类 别 。 

由 上 述 讨 论 可 以 知道 ， 些 不 变 矩 的 方法 较 适 合 应 用 于 样本 之 各 有 一 定 差异 性 的 判读 。 


动手 做 


1 请 利用 小 画家 制作 形状 异 十 本 实验 的 图 形 ,如 梯形 、 正 方形 等 ， 计算 出 其 七 个 不 变 算 ， 
并 观察 与 实验 中 三 种 形状 的 不 变 氮 的 差异 。 

2. 利用 上 题 1 的 结果 党 试 运用 实验 中 的 判断 式 ， 观 察 其 较 容 易 被 妇 类 为 娜 一 类 , 是 咨 和 
直观 的 判断 相同 。 


L10.2 模糊 聚 类 


原 理 


模糊 聚 类 的 基本 原理 是 在 给 定 的 样本 中 找 出 各 样本 与 各 群 的 归 忆 度 矩阵 。 第 ;个 样本 x 
若 属 于 第 7 类 ,， 则 其 必 有 较 大 的 归属 值 地。 详细 原理 请 看 本 书 10.3-3 节 。 


程序 范例 


1. 目的 
随机 产生 一 些 2 维 的 数据 ， 并 依照 10.3-3 节 的 步 又 实现 FCM 算法 。 
2. 程序 及 说 明 


%% 程 序 L10_2.m: 模糊 聚 类 % 

5%% 模糊 C- 平 均 (FECMD 算法 色 

%% :输入 样本 数 , dimen- 样 本 维度 % 
冯 基 输入 样 本 (N*dimen) 奴 

% chmster' 群 数 ,7 指数 型 权重 (1<m % 
鸣 tolerance: 误 差 痪 界 值 % 

吕 U: 分 割 矩 阵 { 大 小 为 clustet* 吧 
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clearT; 有 gure; 

X= Tand(200,2); 

[Ndimen]=size( 其 ); 

PIGtCRC 7》 其 人 2 8xXis(f-0.1 1.1 -0.1 1.1) 
hold on 


六 步骤 一 : 设 定 一 些 初 值 及 初始 分 割 矩 阵 %% 
clustet=4; re2; tolerance 一 1]e-S; CYCle=S00; 
U=randfclustetN); 

SS 一 SUmUU]; 


U_new=UJss(onesfclusten172y; % 者 始 模糊 分 割 矩 阵 


for 工 =1:Cycle 
% 步 双 二: 计算 模 籽 聚 类 中 心 % 
U=U_neWW; 
Uexp=U.Ar， 
C=Uexp*X,( (onestdimen]l)*xsumtUexp9 ) % 新 群 心 的 值 
piettCtThC0C2hto 


%% 步 李 三 : 计算 新 的 分 割 算 阵 % 
加 r ]1:cluster 
distdke:)=sqrt(lsumf ((X- ones(GN CU 2 证 
end 
temp=distAC2Hr1y); 叹 计算 新 的 分 宕 矩阵 〈1<D) 
Unew=tetnp.AOohesfelustet 1j#Sutnttetmp hi; 


% 步骤 四 : 计算 成 本 函数 值 % 
cost(L)=sumtsumt(dist^2).4Uexp)) %% 成 本 函数 
二 rintf 递 归 循 环 次 数 = %% 出 成 本 国 数 值 = % fua, L, costEL)); 
计 世 >1， 

这 absfeost(L)-cost(L-1))<tolerance 
break 
end， 
end 

end 

hold o 企 

disp( 最 后 群 心 的 值 =7; disp(O) 


3. 结果 展示 


最 后 群 心 的 值 = 
0.699 3 
0.2349 
0.776 1 
0.2659 
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图 L10.2-1 将 输入 样本 分 为 四 类 时 ， 执 行 FCM 算法 的 聚 类 结果 
递归 循环 次 数 = 56， 成 本 函数 值 = 4.901436 


人 78S 2 
0.2412 
0.366 4 
0.6890 
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整个 过 程 应 用 了 模 精 理论 中 分 割 矩 阵 的 方法 求 出 群 心 坐标 ， 此 分 割 矩阵 即 代表 了 各 样本 
在 各 群 的 归属 值 。 接 下 来 要 做 的 工作 可 以 很 直觉 的 知道 ， 对 一 新 图 像 模式 计算 其 与 各 群 心 的 


距离 ， 如 此 即 可 做 一 简单 分 类 。 


动手 做 


1 改变 指数 型 权重 ~ 的 值 ， 观 察 其 在 选 代 过 程 中 对 群 心 位 置 变化 的 影响 。 


L10.3 利用 人 工 神经 网 络 做 图 像 模式 识别 


原 理 


人 工 神经 网 络 是 一 种 非 线性 的 映射 方式 ， 它 将 输 人 的 特征 值 映 射 到 网 络 的 输出 分 类 结 
果 ， 并 可 依照 其 分 类 的 误差 大 小 或 某 些 能 量 本 数 来 调整 网 路 中 的 加 权 值 使 其 达到 收 剑 。 以 下 
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我 们 使 用 被 广 为 应 用 的 反 向 传播 网 络 来 说 明 其 在 分 类 辨识 上 的 应 用 。 有 关 反 向 传播 网 络 的 介 
绍 请 看 本 书 10.4-3 节 。 


程序 范例 


1, 目的 
以 反 向 传播 人 工 神经 网 络 辩 识 工 形 、 三 角形 及 梯形 三 个 基本 几何 图 形 ， 不 论 其 被 放大 、 
缩小 或 旋转 均 能 正确 归 类 。 这 三 种 图 形 的 基本 样式 如 图 二 10.3-1 所 示 。 


国人 全 


图 L40.3-4 三 个 待 辩 识 的 基本 几何 图 形 


利用 19.1 的 程序 ， 分 别 对 工 形 、 三 角形 及 梯形 三 张 图 像 做 缩小 及 放大 。 在 将 原 图 、 放 大 
乒 及 其 缩小 版 均 旋 转 0 、90*、180 、270s*， 如 此 每 张 图 像 可 得 到 12 组 特征 ， 三 张 图 像 共 36 
得 特征 ， 分 别 列 于 表 直 10.3-1 至 囊 直 10.3-3 
表 Lt0.3-{ 上 形 的 特征 
人 08790 2862 人 0 52247 站 6925 10.3393 12373 有 的 和 4 








0.8793 2.8560 53600 4.6912 103511 62152 93175 








汀 小 0.8791 2.8458 5.4844 46966 10.3287 62130  8212 
1.8787 2.848 了 52720 4.7257 9.8837 6.232 中 93294 
0.38790 2.8620 52247 46925 103393 2373 96664 
0.8791 28588 552944 46918 107808 60622335 92765 
人 0.8790 2.8538 5.3469 46946 103427 62246 07385 
0.8788 28552 52587 47088 10.1860 6234 人 0 9.281 1 
48 和 93286200 52247 46925 103393 62373 9.6664 
大 0.879 人 2.8604 3259D 4.6922 117206 62312 9255 
放 


0.8790 2.8579 52844 46936 10.3443 三 2308 97014 


0.87893 2.83S85 32443 47005 10.5672 62353 9237 1] 
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表 L10.3-2 ”三 角形 的 特征 
09249 2.8693 7.9370 5.4538 12.4253 68939 124091 
0.9251 2.8683 6.7087 54263 11.6152 6.8680 117570 
第 人 09245 28588 62761 54278 1L4189 6.8756 11.5530 
0.9246 2.8604 62066 53947 11.2272 6.8391 12.9269 
0.9238 2.8670 82272 54562 12.6227 68939 12.3602 
0.9239 2.8664 7.2132 354417 11.9457 68802 11.9295 
划 芝 09237 28619 68256 54429 11.8063 68828 11.7308 
09237 28630 68066 54250 11.5630 68643 12.4033 
09236 2.8684 87215 54719 13.5994 69076 12.5756 
09236 2.8680 7.8926 54644 12.5298 69003 12.1899 
芝 大 0.9235 2.8658 7.4637 54655 12.3642 69013 11.9738 
0.9236 “2.8664 7.5463 54560 11.9881 68918 12.4433 
表 L10.3-3 梯形 的 特征 
0.9178 2.9375 6.5121 58739 12.6792 73685 11.9280 
0.9180 29366 66493 58327 13.2480 7.3301 12.170& 
箱 人 09177 2.9265 6.2809 58374 11.8109 7.3509 11.7815 
09188 2.9298 69442 57604 122196 7.2664 12.7700 
0.9163 2.9359 6.4882 5.8850 12.6862 7.3815 11.9144 
0.9165 29354 65996 58626 12.5414 7.3603 12.2147 
原 图 09163 29304 64758 5.8658 12.2054 7.3717 11.8296 
0.9168 2.9322 7.1301 5.8253 13.2897 7.3270 12.3795 
0.9156 。 2.9352 64732 5.8905 12.6622 7.3867 11.9153 
09157 2.9350 和 5378 58787 12.3782 7.3752 12.2467 
区 六 0.9156 2.9324 和 4999 5.8808 12.7523 7.3814 11.8666 
0.91S9 2.9334 67621 58597 12.4988 73586 12.3107 
给 定 的 目标 输出 值 如 下 ， 


第 一 类 在 形 ) 都 是 (10.0)、 第 二 类 (二 角形) 都 是 人 0,1.0)、 第 三 类 (梯形 ) 都 是 人 0,0.1)。 

网 络 的 学 习 速 度 需 随 训 练 循环 的 增加 而 减少 ， 此 表示 当 训 练 愈 多 时 则 网 络 愈 接近 局 部 最 
小 值 ， 此 时 应 将 学 习 的 步伐 碱 小 使 其 趋 近 最 佳 值 ， 以 免 其 在 加 权 空 间 中 震 功 。 程 序 中 并 如 人 
惯性 项 以 加 速 收 伍 ， 所 谓 民 性 项 表示 上 一 次 修正 量 的 部 分 值 。 


2, 程序 及 说 明 


% 程序 LI0 3.m: 利用 人 工 神 经 网 络 做 图 像 模式 识别 % 


冶 习 : 输入 训练 向 量 吧 
%% 王 输出 目标 向 量 % 
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%hl: 第 一 层 隐 藏 层 神经 元 个 数 % 

吧 eyecie: 训练 循环 %% 

%% 函数 bpnlha0 为 反 疝 传播 网 络 训练 程序 % 
clear 

]oad m 臣 ai 

人 ta 人 7) 

T=fea(:,8:10); 

hl1=7; cycle=10000; 
tcSuit-bpnjiha(X,Thticycleh 


% 函数 bpnlha.m: 一 层 隐 藏 层 芭 向 传播 网 络 (随机 选择 训练 数据 ) % 
fmction iesult=bpnhlhaf( 区 ,Thlicycle) 

儿 X: 输 入 训练 同 量 六 

%% 工 输出 目标 向 量 % 

强 hl1: 第 一 层 隆 藏 层 神 经 元 个 数 吧 

% cycle: 训 练 循环 吧 


吧 Iratefeta}: 学 习 速 度 咯 

XXAmnormCx: %% 输 和 向量 归 一 化 

[N,x]=sizeC; 

ysSizefT,2); 

Jrate 一 0.3; 

%% 产生 万 始 乱 数 加 权 和 值 矩 阵 史 

tseed=prodfclockh; ranmgdf0seed ,tseed; 

Wxh=(randCchl)-0.5》， % 输入 层 一 隐藏 层 间 连结 加 权 值 
Wiby=Gandthlyyr0.57 % 隐藏 层 一 输出 层 间 连结 加 权 值 
theta hi=(tandfl.h1)-0.5)， 嗓 隆 藏 层 神经 元 阔 值 

theta_ (rand(],y)-0.5); % 输出 层 神经 元 阐 值 


%% 配置 一 些 程序 万 值 及 存储 空间 冶 
pWxh=0; pWhy=0; ptheta hl1=0: ptheta_y=-0; 
LImSs=zerosf1cycle); eta=Lrms， 


for 工 一 1:cych 
Mnrms=0; 工 
lrate==ltrate*0.999; etalL)=lrate， 只 学 习 速 度 误 减 
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SN 
forn=l:N 
alengthfs); % 随机 选择 训练 数据 


b=fix(((a+0.4)-1*rand(1)) +1， 
n=s(b); Sb)[]; 


5% 计算 神经 元 输出 值 % 
RetI=Xfn,:)WxXh-theta h1; 
责 1=(exp(nhett)j-exp(-netl.(explnetl)Hhexpf-net1y); 
ae 世 2= 肌 isWhy-theta y; 
Y=(exp(net2])-exP(-net2 人 .exp(net2)+exXP(-ne 包 放 ; 


叹 计算 均 方 根 误差 史 
ImSs=SqrtSumT0n -TY). 2， 


Nms=Nrms+irms; 


冯 计算 修正 量 鸣 
Dy1+ 妆 (1-Y).eCTCn)-Y); 
了 Why=eta(L) (OLDy); 
Dtheta_y=-eta(L)*Dy; 
Dhli=(1+Hl).*(1-HIJ.eDy*Why)， 
DWxh=eta(D)*CXKCoJsDhl); 
Dtheta_ h1=-eta(L)*Dhl; 


5 更 新 加 权 值 及 阔 值 % 
Why = Why +Dwhy +PWhy; 
更 站 = WXh + 了 克 xh+PWxhi 
theta_ y =theta y 十 Dtheta y +ptheta y ; 
tbheta_ hl = theta_ hl + Dtheta ht + ptheta hl; 


jwWxh = rmst+DWXh ; % 惯性 项 
PWhy = rms*Dwhy; 
btheta hl = rmas*Dtheta hl ; 
btheta_y = tms*Dthe 雪 7; 
end 
LIms(L) = NrmsAN ; 
end 
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%% 结 果 %% 

Final rms = Lrmstcycle) 
subpiot(211，Plot(etayj，ylabelClate5 ，xlabeleray 个 
subplot(212)，plot(Lrms)，ylabel(rms)，xlabel(b)) 


入 友 向 过 程 (inside testy 冯 
tesult= [cor = 0; 
fora=1: 
Detl = 其 (nn : )#Wxh - theta hl ; 
瑟 ] = (exp(netl)y - exp( - netl))VCexptnet1) + exp( -Detl7); 
net2 = H1*Why - heta_y; 
Y= (expnet2) -exp(- De))MEXpPGnet2) + exp( 一 Det2); 
[val, index] = max(Y); 立 = zeiosfl, y); 
Yfindex) = 1; 
result = [result;， YY ; 
过 Y= =Tn :) 
Corr = Corr 二 1; 
end 
enid 
COIT % 分 类 正确 个 数 
(corvNi*100 。 %% 识 别 率 








3. 结果 展示 





注 ; 所 学 习 建 率 全) 均 方 根 误 莱 
图 L10-3.2 ” 反 向 传播 网 络 参 效 的 变化 情形 
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Final rms = (最 后 的 均 方 根 误差 值 ) 


co = (正确 分 类 的 样本 个 数 ) 
36 

ans = (识别 率 ) 
100 

Tesult = (测试 各 个 样本 的 结果 ) 


36 组 向 量 中 第 1 ~ 12 个 的 输出 均 为 (100)， 表 示 其 被 判断 为 工 形 ; 第 13 ~24 个 的 输出 均 
为 人 ,1. 自 ， 表 示 其 被 判断 为 三 角形 ; 第 25~36 个 的 输出 均 为 旭 ,1.0)， 表 示 其 被 判断 为 梯形 。 
讨 论 


三 角形 与 梯形 在 视觉 上 是 可 了 明显 区 分 的 两 类 , 但 从 特征 值 上 来 看 , 两 者 几乎 无 明显 差 虐 。 

实验 中 选择 不 同 的 学 习 速 度 衰减 量 、 不 同 的 隐藏 层 神经 元 个 数 及 不 同 的 训练 循环 对 结果 
均 有 影响 ， 其 中 学 习 速度 衰减 量 最 敏感 。 经 过 多 次 党 坛 ， 当 选择 0.999 时 可 有 和 良好 收 伍 ， 太 
大 或 太 小 的 值 均 无 法 得 到 最 好 的 结果 。 . 

使 用 反 回 传播 网 络 对 于 此 种 无 明显 差距 的 特征 向 量 依然 能 够 完成 分 类 ， 由 此 可 见 其 在 分 
类 辨识 上 的 潜力 。 


动手 做 
1. 改变 耻 藏 层 神经 元 hl 的 个 数 ， 并 观察 其 是 否 将 影响 最 后 收敛 的 结果 。 


L10.4 以 反问 传播 网 络 做 模糊 分 类 


原 理 


模糊 理论 与 神经 网 络 的 结合 是 一 种 相当 新 的 应 用 方式 ， 其 中 一 种 结合 方式 的 基本 概念 是 
先 以 模糊 化 的 方式 对 输入 特征 做 杆 处 理 ， 或 是 经 由 各 样本 间 的 关系 计算 出 其 各 自 的 归属 程 
度 ， 再 将 这 些 新 的 数据 加 人 神经 网 络 中 或 蔡 代 网 络 中 的 某 些 连 结 ， 汶 加 速 网 络 的 收敛 速度 或 
降低 网 络 的 复杂 关 。 


程序 范例 


1. 目的 
使 用 寞 精 化 的 方法 先 对 输 和 人 数据 向 预 处 理 再 进行 识别 ， 观 察 其 对 网 络 收 伍 的 影响 。 利 用 


-324 - ”数字 图 像 处 理 


实验 L10-3 中 得 到 的 36 组 不 变 征 特征 进行 三 个 基本 区 像 模 式 的 识别 , 不 同 之 处 在 于 目 慰 输出 
值 的 给 定 。 此 处 是 将 经 过 模糊 化 预 处 理 后 得 到 的 归属 值 代替 目标 输出 。 于 是 目标 输出 值 不 再 
是 0 或 1， 而 是 界 于 0- 1 之 间 的 值 ， 所 以 网 络 的 反 向 过 程 也 必须 稍 加 修改 . 

2. 程序 及 说 明 


蚤 程序 L10 4.m: 以 反 向 传播 网 络 做 模糊 分 类 %% 
elear; 

%% 模糊 化 预 处 理 % 

C=3; %% 分 类 个 数 
arfa=2; beta=]1.25， 

103ad 他 a 

天 =fea, N=Sizef 居 1); 

Cl1= 基 (12 C2 一 其 (24 03 一 其 ( 了 各: 
M=[meantcl); meanfc2); meantc3)] %% 各 类 的 平均 值 
V=f stdlel) stdfc2) stdfc3]]; %% 各 类 的 标准 差 


for i=1N % 加 权 距 离 任 阵 
ZJsqrtlsumf(((ones( 人 CT X(-MDAY7 2 

end 

meu=1. 人 1L+(ZAarfa).^betaji 冯 各 样本 的 归 展 值 

况 以 反 向 传播 网 络 进行 识别 % 

T=meu: hl=7; cycle=10 000; %% 将 归属 值 当成 目标 输出 

ITesuitbpnlhb(X,Thlicycle); 铝 bpntihbm 与 LI0 3.m 中 的 bpnIham 


难 在 反 向 过 程 稍 有 不 岂 , 请 自行 比较 
% 函数 bpnlhhb.m: 一 层 隐藏 层 反 向 传播 网 络 〈 随 机 选择 训练 数据 ) % 
%% 导 :输入 训练 向 量 号 
%%T 和 输出 目标 向 量 % 
%%bl :第 一 层 隐 藏 层 神经 元 个 数 吧 
吃 cycle: 训 练 循 环 %% 
olrate(eta]: 学 习 速 度 只 


fnction Testutit =bpnlhbf(X,Thlcycle) 

X=XAnonmmnfX): % 输入 向 量 归 一 化 
[DN,xX]=size(Xy 

ysSize(T,2); 

rate=0.5; 

% 产生 初始 乱 数 加 权 值 符 阵 %% 

tseed=-prodfclock); randf0seed',tseed， 

WWxh=frand(xh1)-0.5)， % 输 和 人 层 一 隐藏 层 间 连结 加 权 值 
Why=(tand(hl -0.5); % 隐藏 层 一 输出 肢 间 连结 加 权 值 
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theta hl1=(randflh1)-0.9); % 隐藏 层 神经 元 益 值 
teta_y=(rand(1,7)-0.35); % 输出 层 宰 经 元 阁 值 
% 配置 一 些 程序 初 值 及 储存 空间 多 

PPWxh=0; pWhy=0; ptheta hl1=0; ptheta y=-0; 
Lintms=2zefosf1,cyele); eta=Lrims; 

fr T=1:0yce 


Nrms=0; 上 上 
trate=lratey0.999; eta(LJ=lrate; %% 学 习 速度 衰减 
Ss=1:]; 
for n=1:N 
a=lengthfs); % 随机 选择 训练 数据 


bfxt((a+0.4)-1)*randf1 访 +1， 
ms) Sb 关 让 
吧 计算 神经 元 输出 值 % 
metl=X(n:)*#WXh-theta hi; 
瑞 1=(expPfnet1l)-exp(-netl)) expfnetlyHhexP(-netl) 
He 要 一 开 ] 站 Why-theta_y; 
Y-(expftnet2)-expf-net2))Jexpfnet2J+HeXP(-net2yy 
只 计算 均 方 根 误 差 % 
Ts=SqrtSUmACT(n-)-Y). 2Jy7) 
NIns=Nrtms+rms; 
% 计算 修正 量 %% 
DY 一 (+ 说 (YY TD 
DWhy=eta(D*Hi*Dy); 
Dtheta_y=-eta(L)*Dy; 
Dhl=(1+HU.*(1-H1D.*(Dy*Why); 
下 Wxh=etafL)*fXn Je*Dhl); 
Dtheta_h1=-eta( 二 )*iDh]， 
缀 更 新 加 权 值 及 阐 值 %% 
Why=Why+DWhy+pWhby: 
WXh=WxhrtDWxh+rpWxh; 
theta_y =theta y +Dtheta_ y +ptheta y ; 
也 eta hl=theta hi+Dtheta hl+ptheta hl; 
PWxh=rms+DDWxh; 冶 慑 性 项 
PWhy=nmns*+DWhy; 
btheta hli=rms*LDtheta ht; 
Ptheta_y =rms*Dtheta_y; 

end 


Loms(D=Nmm/N ; 
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end 


嗓 结 果 站 
Final rms=Lrms(cycle) 
Subplot(211) plot(etal, ylabelflrate), xlabelt(a) 
subplot(212), Plot(LTrms)y, ylabelionns xlabelCtb)) 
儿 反 向 过 程 (inside testb %% 
resuit=-[] corr-0; 
forn=l:N 
net1= 其 Cn,:)*WXh-theta hl; 
也 1=(exbpfnetl)-exp(-netl))AexpfnetlyHexPp(-netl 
De 人 2= 下 1#WBy-theta_y: 
Y= expnet2)-exp(cnet2))V(exp(net2)Hexp(-net2) 
[val_yindex_7Y]=max(Y); 
[val bindex tj=max(TCn,)); 
result=-[result Y]; 
认 index 天 一 index ft 
CoM 一 COTT+1; 
end 
end 
Co %% 分 类 正确 个 数 
{corVN)*10 的 站 识 别 率 


3. 结果 展示 





Do 





ee ee ee 





ee 一 一 

并 aa | 

DO 053000.4000.500026000 7000 8000 959600710000 
2 





注 : 全 学 习 速 并 ;人 b) 均 方 根 误 革 
图 L10.4-1 以 反 向 传播 网 结 做 模糊 分 类 的 结果 
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Final_rms = { 最 后 的 均 方 根 误 差 值 ) 
0.0896 
corr = (正确 分 类 的 样本 个 数 ) 
36 
ans 一 (识别 率 ) 
14100 
讨 论 


比较 图 直 10.3 - 2 与 图 工 10.4 - 1， 可 看 出 直接 做 反 向 传播 网 络 的 实验 ， 大约 在 第 7 500 个 
矫 环 左右 时 网 络 即 不 再 震 切 ， 而 先 经 模 硼 化 预 处 理 的 实验 则 在 第 6 500 个 循环 附近 时 即 已 趋 
于 平稳 .此 比较 说 明了 做 模糊 化 预 处 理 的 好 处 。 


动手 做 
1. 试 着 微调 w (ar 与 8 (beta) 的 值 ， 观 察 其 对 归属 值 刀 的 影响 。 
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光盘 内 容 简 介 及 使 用 说 明 
1. 光 组 内 容 


本 说 明 置 于 readme.txt 文件 中 。 在 本 书 第 二 部 分 所 有 的 程序 范例 及 相关 的 图 像 文件 均 放 
在 本 光盘 中 。 以 章 为 单元 分 类 ， 每 章 有 独立 的 子 目录 ， 子 目录 下 为 各 章 的 内 容 。 以 下列 出 所 


有 文件 的 名 称 及 其 功能 。 


bp (额外 可 供 实验 的 bmp 图 像 文件 ) 
baiii.bmp ball2.bmp bali3.bmp ball4.bmp ball.bmp ”ball6.bmhp 
ball7.bmp ball8,bhmp ball9.btp balll0.bmp 
cat,bmp 
crossl.bmp cross2.bmp 
diskl.bmp disk2.bmp ”disk3.bmp disk4.bmp disksbmp disk6.bmp 
disk7.bmp disk8.bmp disk9.bmp 
外 全 bmp 
sign1.bmp sign2.btmp 
Ch2 


L2 1.m: 二 维 卷 积 (程序 ) 
L2_2.m: 和 矩阵 的 直 积 (程序 ) 
L2_3.m: 马尔 可 夫 链 的 转移 概率 (程序 ) 


ch3' 


L3_1.m: 纯 量 量化 器 的 设计 (程序 ) 

L3_2.m: 量化 造成 的 像 轮 廊 (程序 ) 

L3 3.m: 向 量 量化 器 的 码 本 的 产生 (程序 ) 

L3_4m: 利用 工 BG 训练 三 个 不 同 大 小 与 维度 的 码 本 并 分 别 进 行 VQ (程序 ) 
gau.m: ML 量化 器 设计 中 分 母 的 计算 式 (函数 ) 

gaulm: ML 量化 器 设计 中 分 子 的 计算 式 (本 数 ) 

LBGm: LBG 训练 法 (函数 ) 

quantize.m: 高 斯 概率 密度 函数 的 非 均匀 量化 (函数 ) 


旧 - 


VQm: 向 量 量 化 (函数 ) 
L3 2.bmp: 图 像 文件 
lena.mat: Matlab 的 年 阵 变量 文件 


Ch 


L4 1.m: SVD 变换 (程序 ) 

L4_22n: 图 像 变换 的 能 量 集中 能 力 (程序 ) 
L4_3am: 小 波 变换 的 多 重 解析 结构 (程序 ) 
L4_3b.m: 小 波 变换 系数 与 图 像 前 方向 性 (程序 ) 
energym: 能 量 集中 【函数 ) 

L4_l1bmp: 图 像 文件 

L4_2bmp: 图 像 文件 

L4 3b.bmp: 图 像 文 件 

woman.mat: Matlab 的 皇 阵 变量 文件 


chS 


L5_ lm: 直方 图 均衡 化 法 (程序 ) 
L5_2.zm: 平滑 滤波 器 (程序 ) 
L5_3.m: 同 态 滤 波 器 (程序 ) 
L5_1.bmp: 图 像 文件 

L5_ 2.bmp: 图 像 文 件 

L5 3.bmp: 图 像 文件 


Ch 


L6_1.m: 最 小 平方 滤波 器 (程序 ) 
L6 _2.m: 选 代言 目 去 卷 积 法 (程序 ) 
L6_1.bmp: 图 像 文件 
L6_2abmf: 图 像 文件 
L6_2b.bmp: 图 像 文件 

Ch 人 


L7_1.m: 游程 长 度 编码 (程序 ) 

L7 2.m: 应 用 小 波 变换 与 向 量 量化 做 图 像 压 缩 (程序 ) 
RLEm: 游程 长 度 编 码 (本 数 ) 

LBGm:LBG 训练 法 ( 苗 数 ) 

VQJa: 向 量 量化 (函数 ) 

L7_labmp: 图 像 文件 

LI7_lb.bmp: 图 像 文件 
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jena.mat' Matiab 的 所 阵 变 量 文件 
和 全 


L8_l.m: 像素 取 类 区 域 成 长 法 (程序 ) 

L8_2. 如 : 四 浆 树 区 域 分 割 与 合并 法 ( 枉 序 ) 

L8_3.m: Sobel 边缘 检测 ( 牌 序 ) 

L8 4.m: 拉 氏 边界 检测 法 (程序 ) 

L8_5m: LUM 滤波 器 (程序 ) 

LUMm: LUM 滤波 器 (函数 ) 

tegiongrowm: 像素 聚积 成 长 法 ( 阔 数 ) 

sobelim: sobel 算 子 (了 落 数 ) 

L8_1.bmp: 图 像 文件 

L8 2.bmp: 图 像 文件 

L8 4.bmp: 图 像 文件 

lena.mat: Matlab 的 矩 蜂 变量 文件 
chen 


L9_1.m: 不 变 矩 (程序 ) 
L9_2.n: 细 化 (程序 ) 

L9 3.m: 及 胀 与 广 蚀 (程序 ) 
L9_4m: 断 开 与 闭合 (程序 ) 
invariance.im: 不 变 矩 (函数 ) 
thin.m: 细 化 (函数 ) 
L9_l.bmp: 图 像 文件 

L9_ 2.bmp: 图 像 文件 

L9 3.bmp: 图 像 文件 

L9 4a.bmp: 图 像 文件 

L9 4b.bmp: 图 像 文件 


chl1A 


L10_1m: 利用 不 变 乞 判定 图 形 类 别 (程序 ) 

L10_2.m: 模糊 取 类 (程序 ) 

L10_3.m: 利用 人 工 神经 网 络 做 图 像 模 式 识 别 (程序 ) 

L10 4m: 以 反 向 传播 网 络 做 模糊 分 类 ( 牌 序 ) 

bpniha.m: 一 屋 陷 藏 层 反 向 传播 网 络 〔 随 机 选择 训练 数据 ) (函数 ) 
bpnlhb.m: 一 层 系 藏 层 反 向 传播 网 络 《随机 选择 训练 数据 ) (函数 ) 
invariance.m'; 木 变 矩 (函数 ) 

L10_la.bmp: 图 像 文件 
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LI10_lb.bmp: 图 像 文件 

L10_ lc.bmp: 图 像 文件 

丰 a.mat: Matlab 的 矩阵 变量 文件 
ip_feamat' Matlab 的 矩阵 变量 文件 


2. 使 用 说 明 


文件 内 容 分 成 四 类 ， 第 一 类 是 一 般 的 程序 ， 第 二 类 是 可 由 程序 调用 的 函数 ， 第 三 类 是 供 
实验 用 的 图 像 文 件 , 第 四 类 是 Mattab 的 第 阵 变量 文件 。 所 有 程序 或 函数 均 在 PC 版 Matlab 5.1 
的 环境 下 开发 完成 ， 其 中 许多 程序 和 函数 会 用 到 Matiab 的 图 像 工具 箱 (image topolboa， 少 部 
分 会 用 到 Matiab 的 小 波 工具 箱 (wavelet tooiboxj。 使 用 上 述 程 序 只 要 按照 Matlab 的 一 般 规 定 
将 相关 文件 案 copy 到 Matlab 里 的 适当 目录 下 就 可 使 用 了 。 
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